苟浩

Kernel源码笔记之VFS：4.打开文件

Kernel源码笔记目录

打开文件

简介

打开文件主要是建立file, dentry, inode这三个数据结构，以及将它们三个关联起来。如果文件不存在的话，还要新建inode对象。

打开文件主要有下面几个过程：

根据用户层传下来的标志，做一些检查和转换；
获取一个没有使用的fd，fd是一个整数，对应的是file在数组里的下标及几个位标志里的第几位。在这个过程中，如果进程打开的文件数量太多，还要对这些数组，位标志进行扩容；
遍历路径，调用具体文件系统打开或者创建inode, dentry;
创建file对象，把file对象和dentry, 具体文件系统操作函数表等关联；
把file设置到数组里fd对应的位置。

open系统调用

SYSCALL_DEFINE3(open, const char __user *, filename, int, flags, umode_t, mode)
{
    // 如果CONFIG_ARCH_32BIT_OFF_T这个配置没打开，则force_o_largefile返回true
    // 这个标志一般都没开
	if (force_o_largefile())
		flags |= O_LARGEFILE;
    // 打开文件
    // AT_FDCWD表示从当前目录开始查找
	return do_sys_open(AT_FDCWD, filename, flags, mode);
}

long do_sys_open(int dfd, const char __user *filename, int flags, umode_t mode)
{
    // build_open_how把flags和mode打包到open_how这个结构体里，并且做了一些简单的处理
	struct open_how how = build_open_how(flags, mode);
	return do_sys_openat2(dfd, filename, &how);
}

inline struct open_how build_open_how(int flags, umode_t mode)
{
	/**
	#define VALID_OPEN_FLAGS \
	(O_RDONLY | O_WRONLY | O_RDWR | O_CREAT | O_EXCL | O_NOCTTY | O_TRUNC | \
	 O_APPEND | O_NDELAY | O_NONBLOCK | __O_SYNC | O_DSYNC | \
	 FASYNC	| O_DIRECT | O_LARGEFILE | O_DIRECTORY | O_NOFOLLOW | \
	 O_NOATIME | O_CLOEXEC | O_PATH | __O_TMPFILE)
	**/

	/**
 	#define S_IALLUGO	(S_ISUID|S_ISGID|S_ISVTX|S_IRWXUGO)
	**/
	struct open_how how = {
		// VALID_OPEN_FLAGS是目前open支持的所有标志，
		// 这里是将用户层传下来的flags做过滤，只保留支持的标志
		.flags = flags & VALID_OPEN_FLAGS,
		// mode用在创建文件时，S_IALLUGO是文件的所有权限，
		// 这里将用户层传下来的创建模式做过滤
		.mode = mode & S_IALLUGO,
	};

	// O_PATH是只打开目录路径，不跟踪链接
	if (how.flags & O_PATH)
		// #define O_PATH_FLAGS		(O_DIRECTORY | O_NOFOLLOW | O_PATH | O_CLOEXEC)
		how.flags &= O_PATH_FLAGS;

	// 如果不是创建文件就把mode置0，
	// #define WILL_CREATE(flags)	(flags & (O_CREAT | __O_TMPFILE))
	// __O_TMPFILE是创建临时文件
	if (!WILL_CREATE(how.flags))
		how.mode = 0;
	return how;
}

static long do_sys_openat2(int dfd, const char __user *filename,
			   struct open_how *how)
{
	struct open_flags op;
    // 对flags进行处理，并转换成open_flags
	int fd = build_open_flags(how, &op);
	struct filename *tmp;

    // 如果检查标志出错，直接返回
	if (fd)
		return fd;

    // 把文件名从用户空间复制到内核空间
	tmp = getname(filename);
	if (IS_ERR(tmp))
		return PTR_ERR(tmp);
    // 获取一个未使用的文件描述符
	// 在进程里有个数组，里面放的是已打开的文件，fd实际上就是数组的下标
	fd = get_unused_fd_flags(how->flags);

	if (fd >= 0) {
        // 打开文件，并创建一个file对象
		struct file *f = do_filp_open(dfd, tmp, &op);
		if (IS_ERR(f)) {
            // 如果失败，则释放fd
			put_unused_fd(fd);
			fd = PTR_ERR(f);
		} else {
            // 通知有文件打开
			fsnotify_open(f);
            // 把文件描述符和file对象关联，并设置到进程的相关结构中
			fd_install(fd, f);
		}
	}
	// 释放文件名占用的内存
	putname(tmp);
	return fd;
}

open是打开文件的入口，当然还有其它类似的接口，但是都差不多。主要函数是do_sys_openat2，它执行打开的主要流程。

转换用户层的flags

用户层使用的flag和内核里用到的有些区别，要对其进行检查、转换、补充。

inline int build_open_flags(const struct open_how *how, struct open_flags *op)
{
	u64 flags = how->flags;
	// FMODE_NONOTIFY是做文件操作时不通知，内核里有个notify的文件系统
	// O_CLOEXEC是在exec时关闭文件，主要用于父子进程共享文件
	u64 strip = FMODE_NONOTIFY | O_CLOEXEC;
	int lookup_flags = 0;

	/**
	#define O_ACCMODE	00000003
	#define O_RDONLY	00000000
	#define O_WRONLY	00000001
	#define O_RDWR		00000002

	#define ACC_MODE(x) ("\004\002\006\006"[(x)&O_ACCMODE])
	这个ACC_MODE等价于：
	a[4]={4,2,6,6}
	#define ACC_MODE(x) a[x & 0x11]

	这里主要对用户层访问模式进行转换：
	user_flag     acc_mode
	0(只读)				4 ( r-- )
	1(只写)				2 ( -w- )
	2(读写)				6 ( rw- )
	**/
	int acc_mode = ACC_MODE(flags);

	// VALID_OPEN_FLAGS超过32位，编译报警？
	BUILD_BUG_ON_MSG(upper_32_bits(VALID_OPEN_FLAGS),
			 "struct open_flags doesn't yet handle flags > 32 bits");

    /**
	 去掉FMODE_NONOTIFY | O_CLOEXEC这两个标志
	 todo: 为啥要去掉
    **/
	flags &= ~strip;

    // 如果flags里有不允许的打开标志，则返回错误
	if (flags & ~VALID_OPEN_FLAGS)
		return -EINVAL;
    
    // todo: resolve是啥标志？
	if (how->resolve & ~VALID_RESOLVE_FLAGS)
		return -EINVAL;

	if ((how->resolve & RESOLVE_BENEATH) && (how->resolve & RESOLVE_IN_ROOT))
		return -EINVAL;

	if (WILL_CREATE(flags)) { // 有创建文件的需求
        // 创建文件时，如果有除了S_IALLUGO的其它标志，则返回错误
		if (how->mode & ~S_IALLUGO)
			return -EINVAL;

        // S_IFREG是普通文件，用open只能创建普通文件
		// 目录或者其它文件有专门的系统调用，比如:mkdir, mknod等等
		op->mode = how->mode | S_IFREG;
	} else {
        // 如果不是创建文件，就不能指定mode，否则出错
		if (how->mode != 0)
			return -EINVAL;
		op->mode = 0;
	}

	if (flags & __O_TMPFILE) { // 创建临时文件
        /**
        #define O_TMPFILE (__O_TMPFILE | O_DIRECTORY)
        #define O_TMPFILE_MASK (__O_TMPFILE | O_DIRECTORY | O_CREAT)      

		创建临时文件不能有O_CREAT标志
        **/
		if ((flags & O_TMPFILE_MASK) != O_TMPFILE)
			return -EINVAL;
		/**
		#define MAY_WRITE		0x00000002
		创建临时文件如果没有写标志，则出错
		**/
		if (!(acc_mode & MAY_WRITE))
			return -EINVAL;
	}
	if (flags & O_PATH) {
		// 检查只打开路径时，是否有非法标志
		if (flags & ~O_PATH_FLAGS)
			return -EINVAL;
		// 只找开路径时，将acc_mode置0
		acc_mode = 0;
	}

	// 如果有同步的标志，则把元数据同步标志也设置上
	if (flags & __O_SYNC)
		flags |= O_DSYNC;

	op->open_flag = flags;

	// 截断文件时需要写权限
	if (flags & O_TRUNC)
		acc_mode |= MAY_WRITE;

	// 追加文件时需要追加权限
	if (flags & O_APPEND)
		acc_mode |= MAY_APPEND;

	op->acc_mode = acc_mode;

    /**
	 intent表示本次open的意图
	 如果有O_PATH只找到路径，则设0
	 否则设置成普通打开文件
	todo: 
	**/
	op->intent = flags & O_PATH ? 0 : LOOKUP_OPEN;

	if (flags & O_CREAT) {
        // 设置创建意图
		op->intent |= LOOKUP_CREATE;

		// O_EXCL表示创建文件时，文件不能存在，
		// 这种情况下不跟随软链接
		if (flags & O_EXCL) {
			op->intent |= LOOKUP_EXCL;
			flags |= O_NOFOLLOW;
		}
	}

    // O_DIRECTORY表示目标必须是一个目录
	if (flags & O_DIRECTORY)
		lookup_flags |= LOOKUP_DIRECTORY;

    // 如果需要跟踪链接，则设置标志
	if (!(flags & O_NOFOLLOW))
		lookup_flags |= LOOKUP_FOLLOW;

    // 设置resolve的标志
	// todo: 何为resolve
	if (how->resolve & RESOLVE_NO_XDEV)
		lookup_flags |= LOOKUP_NO_XDEV;
	if (how->resolve & RESOLVE_NO_MAGICLINKS)
		lookup_flags |= LOOKUP_NO_MAGICLINKS;
	if (how->resolve & RESOLVE_NO_SYMLINKS)
		lookup_flags |= LOOKUP_NO_SYMLINKS;
	if (how->resolve & RESOLVE_BENEATH)
		lookup_flags |= LOOKUP_BENEATH;
	if (how->resolve & RESOLVE_IN_ROOT)
		lookup_flags |= LOOKUP_IN_ROOT;

	op->lookup_flags = lookup_flags;
	return 0;
}

获取一个未使用的fd

进程主要用下面数据结构来管理一个进程与文件相关的东西。

// 进程里用于管理已打开文件的结构是struct files_struct
struct files_struct {
	atomic_t count;
	bool resize_in_progress;
	wait_queue_head_t resize_wait;

	struct fdtable __rcu *fdt; // 指向文件描述表
	struct fdtable fdtab; 
  /*
   * written part on a separate cache line in SMP
   */
	spinlock_t file_lock ____cacheline_aligned_in_smp;
	unsigned int next_fd; // 下一个分配的fd
	
	// 下面这三个变量都是按位记录相应fd
	unsigned long close_on_exec_init[1]; // exec时需要关闭的fd
	unsigned long open_fds_init[1]; // 已经打开的fd
	unsigned long full_fds_bits_init[1]; // 这里面的每一位表示一个32位是不是已经全打开了

	// 保存已打开的file实例，fd就是这个数组的下标
	// NR_OPEN_DEFAULT = BITS_PER_LONG
	struct file __rcu * fd_array[NR_OPEN_DEFAULT];
};

// 这个结构主要用来动态扩展可打开文件数量
struct fdtable {
	// 最大可打开文件的数量
	unsigned int max_fds;
	/**
	 刚开始指向files_struct->fd_array，如果打开的文件数量超过NR_OPEN_DEFAULT，
	 就给fd申请内存，让他指向新申请内存，来扩展已打开文件的数量
	 **/
	struct file __rcu **fd;  
	unsigned long *close_on_exec; // 刚开始指向files_struct->close_on_exec_init，后面再扩展
	unsigned long *open_fds; // 刚开始指向files_struct->open_fds_init，后面再扩展
	unsigned long *full_fds_bits; // 刚开始指向files_struct->full_fds_bits_init，后面再扩展
	struct rcu_head rcu;
};

因为以前内核只支持最大打开NR_OPEN_DEFAULT个文件，为了打开大量文件，就采用了这种动态扩展的方式。fd实际上就是fdtable->fd数组的下标。

int get_unused_fd_flags(unsigned flags)
{
	// RLIMIT_NOFILE是一个进程打开文件的限制数量
	// 默认限制为1024个文件，如果有root权限，可以修改限制，但最大不超过4096
	return __get_unused_fd_flags(flags, rlimit(RLIMIT_NOFILE));
}

int __get_unused_fd_flags(unsigned flags, unsigned long nofile)
{
	// current->files是当前进程已打开文件的管理结构
	return __alloc_fd(current->files, 0, nofile, flags);
}

int __alloc_fd(struct files_struct *files,
	       unsigned start, unsigned end, unsigned flags)
{
	unsigned int fd;
	int error;
	struct fdtable *fdt;

	spin_lock(&files->file_lock);
repeat:
	// 获取文件表
	fdt = files_fdtable(files);

	// start是0
	fd = start;

	// next_fd是下一个应该分配的fd号
	if (fd < files->next_fd)
		fd = files->next_fd;

	if (fd < fdt->max_fds)
		// 找到下一个没有分配的fd
		fd = find_next_fd(fdt, fd);

	error = -EMFILE;
	// 如果fd比限制的打开文件数量多，则出错
	if (fd >= end)
		goto out;

	/**
	 根据需要扩展fdtable中相应的变量
	 返回值：
	 1－已扩展
	 0－未扩展
	 <0－出错
	 **/

	error = expand_files(files, fd);
	if (error < 0)
		goto out;

	// 如果已经扩展了列表，则再重新去上面找一遍
	if (error)
		goto repeat;

	// 重新设置next_fd
	if (start <= files->next_fd)
		files->next_fd = fd + 1;

	// 设置fd对应位的标志
	__set_open_fd(fd, fdt);

	// 根据是否有O_CLOEXEC，设置对应的标志位
	if (flags & O_CLOEXEC)
		__set_close_on_exec(fd, fdt);
	else
		__clear_close_on_exec(fd, fdt);
	error = fd;
#if 1
	// 检查fdt->fd[fd]是否为空，一般都会为空，如果不为空，则强行设为空
	if (rcu_access_pointer(fdt->fd[fd]) != NULL) {
		printk(KERN_WARNING "alloc_fd: slot %d not NULL!\n", fd);
		rcu_assign_pointer(fdt->fd[fd], NULL);
	}
#endif

out:
	spin_unlock(&files->file_lock);
	return error;
}

static unsigned int find_next_fd(struct fdtable *fdt, unsigned int start)
{
	// 最大可以分配的fd
	unsigned int maxfd = fdt->max_fds;
	// 下面2个是标志位的标志位
	unsigned int maxbit = maxfd / BITS_PER_LONG;
	unsigned int bitbit = start / BITS_PER_LONG;

	/**
	 full_fds_bits里保存的是已分配标志位的标志位，如果它为1，就表示open_fds里某个32位已经合部分配，
	 先找出没有分配完的标志位的标志位，然后再乘以BITS_PER_LONG，就得到了对应标志位开始的位置，
	 因为每个标志位存储BITS_PER_LONG个标志
	 **/
	bitbit = find_next_zero_bit(fdt->full_fds_bits, maxbit, bitbit) * BITS_PER_LONG;

	// 如果标志位全部已经分配了，则返回
	if (bitbit > maxfd)
		return maxfd;
	// 让start指向开始分配的标志位
	if (bitbit > start)
		start = bitbit;
	// 找出start中一个空闲位
	return find_next_zero_bit(fdt->open_fds, maxfd, start);
}

static int expand_files(struct files_struct *files, unsigned int nr)
	__releases(files->file_lock)
	__acquires(files->file_lock)
{
	struct fdtable *fdt;
	int expanded = 0;

repeat:
	fdt = files_fdtable(files);

	// 如果要分配的fd比最大可分配fd小，则不用扩展，直接返回
	if (nr < fdt->max_fds)
		return expanded;

	// 如果超过了用户设置的最大打开文件数量，则出错返回
	if (nr >= sysctl_nr_open)
		return -EMFILE;

	if (unlikely(files->resize_in_progress)) {
		// 如果正在扩充files的容量，则等他扩充完了再上去测试一下相关条件
		spin_unlock(&files->file_lock);
		expanded = 1;
		wait_event(files->resize_wait, !files->resize_in_progress);
		spin_lock(&files->file_lock);
		goto repeat;
	}

	// 设置正在扩充的标志
	files->resize_in_progress = true;

	// 真正的扩展
	expanded = expand_fdtable(files, nr);

	// 取消正在扩充的标志
	files->resize_in_progress = false;

	// 唤醒所有在resize_wait上等待的进程，就是上面等待的地方
	wake_up_all(&files->resize_wait);
	return expanded;
}

static int expand_fdtable(struct files_struct *files, unsigned int nr)
	__releases(files->file_lock)
	__acquires(files->file_lock)
{
	struct fdtable *new_fdt, *cur_fdt;

	spin_unlock(&files->file_lock);

	// 申请新内存，并重新设置相关变量
	new_fdt = alloc_fdtable(nr);

	// 如果还有其他人也在使用文件，则要确保其它人读结束，因为下面要设置fdt
	if (atomic_read(&files->count) > 1)
		synchronize_rcu();

	spin_lock(&files->file_lock);
	if (!new_fdt)
		return -ENOMEM;
	// 如果没申请到足够的内存则退出
	if (unlikely(new_fdt->max_fds <= nr)) {
		__free_fdtable(new_fdt);
		return -EMFILE;
	}
	cur_fdt = files_fdtable(files);

	// 上面不是已经判断了吗？什么情况会走到这种情况
	BUG_ON(nr < cur_fdt->max_fds);

	// 把以前fdt中的open_fds， close_on_exec， full_fds_bits
	// 复制到新申请的内存中去
	copy_fdtable(new_fdt, cur_fdt);

	// 设置新的fdt
	rcu_assign_pointer(files->fdt, new_fdt);

	// 等rcu结束后释放旧的fdt
	if (cur_fdt != &files->fdtab)
		call_rcu(&cur_fdt->rcu, free_fdtable_rcu);
	/* coupled with smp_rmb() in __fd_install() */
	smp_wmb();
	return 1;
}

创建file

找到了fd之后，下一步就是要创建file。

struct file *do_filp_open(int dfd, struct filename *pathname,
		const struct open_flags *op)
{
	struct nameidata nd;
	int flags = op->lookup_flags;
	struct file *filp;

	// 设置nameidata相关的数据
	set_nameidata(&nd, dfd, pathname);

	// 打开文件
	filp = path_openat(&nd, op, flags | LOOKUP_RCU);

	// todo: 这些失败情况是什么？
	if (unlikely(filp == ERR_PTR(-ECHILD)))
		filp = path_openat(&nd, op, flags);
	if (unlikely(filp == ERR_PTR(-ESTALE)))
		filp = path_openat(&nd, op, flags | LOOKUP_REVAL);
	
	// 释放nameidata里的相关数据
	restore_nameidata();
	return filp;
}

static void set_nameidata(struct nameidata *p, int dfd, struct filename *name)
{
	// todo: 上一次使用的nameidata？
	struct nameidata *old = current->nameidata;
	// 先让stack指向internal, internal数组大小为2
	p->stack = p->internal;
	// 设置目录的文件描述符
	p->dfd = dfd;
	// 要查找的路径
	p->name = name;
	// 内核对链接的层次数有限制，如果一次遍历的层次太多就会被限制
	p->total_link_count = old ? old->total_link_count : 0;
	// 保存上一次使用的nd
	p->saved = old;
	// 设置进程当前的nd
	current->nameidata = p;
}

static struct file *path_openat(struct nameidata *nd,
			const struct open_flags *op, unsigned flags)
{
	struct file *file;
	int error;

	// 这个函数会在filp_cachep申请一个file结构体
	file = alloc_empty_file(op->open_flag, current_cred());
	if (IS_ERR(file))
		return file;

	if (unlikely(file->f_flags & __O_TMPFILE)) {
		// 如果要求临时文件，则创建一个临时文件
		error = do_tmpfile(nd, flags, op, file);
	} else if (unlikely(file->f_flags & O_PATH)) {
		// todo: O_PATH是什么
		error = do_o_path(nd, flags, file);
	} else {
		// path_init和link_path_walk和遍历路径那一节的逻辑差不多，
        // 但是这里找的是目标节点的父目录，因为在前面设置了flags有LOOKUP_DICTIONARY
		const char *s = path_init(nd, flags);
		while (!(error = link_path_walk(s, nd)) &&
                // 对目标节点进行处理,上面的path_walk找的是父目录
		       (s = open_last_lookups(nd, file, op)) != NULL)
			;
		if (!error)
			// 如果不出错就把file和具体的dentry关联
			error = do_open(nd, file, op);
		// 释放遍历过程中的变量
		terminate_walk(nd);
	}
	if (likely(!error)) {
		if (likely(file->f_mode & FMODE_OPENED))
			return file;
		WARN_ON(1);
		error = -EINVAL;
	}
	fput(file);
	if (error == -EOPENSTALE) {
		if (flags & LOOKUP_RCU)
			error = -ECHILD;
		else
			error = -ESTALE;
	}
	return ERR_PTR(error);
}

struct file *alloc_empty_file(int flags, const struct cred *cred)
{
	static long old_max;
	struct file *f;

	/*
	 * files_stat.max_files是8192,是系统限制的总共文件数量，如果超过了这个数量，
	 */
	if (get_nr_files() >= files_stat.max_files && !capable(CAP_SYS_ADMIN)) {
		/*
		 percpu_counter_sum_positive是get_nr_files的一个精确慢速版本，在这里再判断一次,
		 如果确实超过了最大文件，则退出
		 */
		if (percpu_counter_sum_positive(&nr_files) >= files_stat.max_files)
			goto over;
	}

	// 如果没有超过限制，或者是root用户，则创建文件
	f = __alloc_file(flags, cred);
	// 如果创建文件成功，则递增nr_files
	if (!IS_ERR(f))
		percpu_counter_inc(&nr_files);

	return f;

over:
	// 保存 old_max的值，old_max是个静态变量
	if (get_nr_files() > old_max) {
		// get_max_files就是files_stat.max_files
		pr_info("VFS: file-max limit %lu reached\n", get_max_files());
		old_max = get_nr_files();
	}
	return ERR_PTR(-ENFILE);
}

static struct file *__alloc_file(int flags, const struct cred *cred)
{
	struct file *f;
	int error;

	// 申请一个file
	f = kmem_cache_zalloc(filp_cachep, GFP_KERNEL);
	if (unlikely(!f))
		return ERR_PTR(-ENOMEM);

	// 设置进程的安全上下文
	f->f_cred = get_cred(cred);

	// 调用安全钩子函数
	error = security_file_alloc(f);
	if (unlikely(error)) {
		file_free_rcu(&f->f_u.fu_rcuhead);
		return ERR_PTR(error);
	}

	// 设置使用数量为1
	atomic_long_set(&f->f_count, 1);

	// 初始化锁
	rwlock_init(&f->f_owner.lock);
	spin_lock_init(&f->f_lock);
	mutex_init(&f->f_pos_lock);
	eventpoll_init_file(f);
	f->f_flags = flags;

	// 设置 文件读写模式
	f->f_mode = OPEN_FMODE(flags);
	/* f->f_version: 0 */

	return f;
}

打开或创建目标文件

打开目标文件是根据在父目录里查找或创建文件。

static const char *open_last_lookups(struct nameidata *nd,
		   struct file *file, const struct open_flags *op)
{
    // 父目录
	struct dentry *dir = nd->path.dentry;

    // 打开时的标志
	int open_flag = op->open_flag;
	bool got_write = false;
	unsigned seq;
	struct inode *inode;
	struct dentry *dentry;
	const char *res;

	// 给flags里写入open的目标是打开还是创建文件
	nd->flags |= op->intent;

    // 如果最后节点是 '.', '..', 则找到'.', '..'对应的
    // dentry和文件系统后，再返回重新查找
	if (nd->last_type != LAST_NORM) {
		if (nd->depth)
			put_link(nd);
		return handle_dots(nd, nd->last_type);
	}

	if (!(open_flag & O_CREAT)) { // 不是创建文件
		if (nd->last.name[nd->last.len])
			nd->flags |= LOOKUP_FOLLOW | LOOKUP_DIRECTORY;
		// 去内存里找，找到就返回
		dentry = lookup_fast(nd, &inode, &seq);
		if (IS_ERR(dentry))
			return ERR_CAST(dentry);
		if (likely(dentry))
			goto finish_lookup;

		BUG_ON(nd->flags & LOOKUP_RCU);
	} else { // 需要创建文件
		/* create side of things */
		if (nd->flags & LOOKUP_RCU) {
			if (!try_to_unlazy(nd))
				return ERR_PTR(-ECHILD);
		}
        // 先打一条审计日志
		audit_inode(nd->name, dir, AUDIT_INODE_PARENT);
		// 如果目标节点不是路径的终点，则表示这是中间的一个目录，出错返回
		if (unlikely(nd->last.name[nd->last.len]))
			return ERR_PTR(-EISDIR);
	}

	if (open_flag & (O_CREAT | O_TRUNC | O_WRONLY | O_RDWR)) {
        // 如果有写文件需求,mnt_want_write里会增加mnt的写入计数
		got_write = !mnt_want_write(nd->path.mnt);
		/*
		 * do _not_ fail yet - we might not need that or fail with
		 * a different error; let lookup_open() decide; we'll be
		 * dropping this one anyway.
		 */
	}
	if (open_flag & O_CREAT)
        // 获取 i_rwsem 的写锁
		inode_lock(dir->d_inode);
	else
        // 获取 i_rwsem 的读锁
		inode_lock_shared(dir->d_inode);
	
	// 查找或者创建dentry, inode
	dentry = lookup_open(nd, file, op, got_write);
	if (!IS_ERR(dentry) && (file->f_mode & FMODE_CREATED))
        // 如果没有失败，且创建文件成功，则发送创建文件通知
		fsnotify_create(dir->d_inode, dentry);
    // 释放上面对应的锁
	if (open_flag & O_CREAT)
		inode_unlock(dir->d_inode);
	else
		inode_unlock_shared(dir->d_inode);

    // 递减mnt的计数器
	if (got_write)
		mnt_drop_write(nd->path.mnt);

	if (IS_ERR(dentry))
		return ERR_CAST(dentry);

	if (file->f_mode & (FMODE_OPENED | FMODE_CREATED)) {
        // 操作成功，就释放老的dentry，再把新的dentry设置到nd里
		dput(nd->path.dentry);
		nd->path.dentry = dentry;
		return NULL;
	}

finish_lookup:
	if (nd->depth)
		put_link(nd);
    // 跟踪挂载点和软链接
	res = step_into(nd, WALK_TRAILING, dentry, inode, seq);
    // res不为空表示还要没找完，返回上级函数继续查找
	if (unlikely(res))
		nd->flags &= ~(LOOKUP_OPEN|LOOKUP_CREATE|LOOKUP_EXCL);
	return res;
}

static struct dentry *lookup_open(struct nameidata *nd, struct file *file,
				  const struct open_flags *op,
				  bool got_write)
{
    // 父目录的dentry
	struct dentry *dir = nd->path.dentry;
    // 父目录的inode
	struct inode *dir_inode = dir->d_inode;
	int open_flag = op->open_flag;
	struct dentry *dentry;
	int error, create_error = 0;
	umode_t mode = op->mode;
	DECLARE_WAIT_QUEUE_HEAD_ONSTACK(wq);

    // 如果父目录被删除，则返回错误
	// 删除的时候会先设置dead标志,然后等没人用了再释放结构
	if (unlikely(IS_DEADDIR(dir_inode)))
		return ERR_PTR(-ENOENT);

    // 先删除已创建的标志，因为下面可能要创建文件
	file->f_mode &= ~FMODE_CREATED;
    // 在内存里再查找一遍，避免并发
	dentry = d_lookup(dir, &nd->last);
	for (;;) {
		if (!dentry) {
			dentry = d_alloc_parallel(dir, &nd->last, &wq);
			if (IS_ERR(dentry))
				return dentry;
		}
        /**
            这个函数是检查有无DCACHE_PAR_LOOKUP标志
            这个标志表示dentry是新建立的，如果dentry是新建立的就不用再做
            下面的检查，直接退出循环
        **/
		if (d_in_lookup(dentry))
			break;

        // 走到这儿说明dentry是在内存里找的，就要检查dentry的有效性
        
        // d_revalidate直接调用具体文件系统的d_op的d_revalidate函数去验证
		error = d_revalidate(dentry, nd->flags);
        
		// dentry有效就直接退出循环
		if (likely(error > 0))
			break;
		
		// 如果出错就让dentry无效
		if (error)
			goto out_dput;
		d_invalidate(dentry);
		dput(dentry);
		dentry = NULL;
	}

	// 如果有inode，说明文件已经打开，直接返回
	// 因为inode是共用的
	if (dentry->d_inode) {
		/* Cached positive dentry: will open in f_op->open */
		return dentry;
	}

	// 走到这儿就是在内存里没找到,下面就要去具体的文件系统查找或者创建
	if (unlikely(!got_write)) // 如果不是创建文件就删除截断标志
		open_flag &= ~O_TRUNC;

	if (open_flag & O_CREAT) { // 创建文件
		// 如果是检查文件是否存在，则不截断
		if (open_flag & O_EXCL)
			open_flag &= ~O_TRUNC;
		
		// 如果文件系统不支持acl，就去除文件的umask设置的权限
		if (!IS_POSIXACL(dir->d_inode))
			mode &= ~current_umask();
		if (likely(got_write))
			// 检查写权限
			create_error = may_o_create(&nd->path, dentry, mode);
		else
			create_error = -EROFS;
	}
	// 权限出错则不创建
	if (create_error)
		open_flag &= ~O_CREAT;

	// todo: 原子打开文件？
	if (dir_inode->i_op->atomic_open) {
		dentry = atomic_open(nd, dentry, file, open_flag, mode);
		if (unlikely(create_error) && dentry == ERR_PTR(-ENOENT))
			dentry = ERR_PTR(create_error);
		return dentry;
	}

	if (d_in_lookup(dentry)) { // 新创建的dentry
		
		// 调用具体文件系统来查找文件的inode
		struct dentry *res = dir_inode->i_op->lookup(dir_inode, dentry,
							     nd->flags);
		// 去除DCACHE_PAR_LOOKUP标志，以及其它操作
		d_lookup_done(dentry);

		// 出错
		if (unlikely(res)) {
			if (IS_ERR(res)) {
				error = PTR_ERR(res);
				goto out_dput;
			}
			dput(dentry);
			dentry = res;
		}
	}

	/* Negative dentry, just create the file */
	if (!dentry->d_inode && (open_flag & O_CREAT)) {
		// 这个分支是inode不存在，需要创建
		file->f_mode |= FMODE_CREATED;

		// 打一条审计日志
		audit_inode_child(dir_inode, dentry, AUDIT_TYPE_CHILD_CREATE);

		if (!dir_inode->i_op->create) {
			error = -EACCES;
			goto out_dput;
		}

		// 调用具体文件系统创建一个inode
		error = dir_inode->i_op->create(dir_inode, dentry, mode,
						open_flag & O_EXCL);
		if (error)
			goto out_dput;
	}

	// 出错
	if (unlikely(create_error) && !dentry->d_inode) {
		error = create_error;
		goto out_dput;
	}

	// 读取inode成功，返回dentry
	return dentry;

out_dput:
	dput(dentry);
	return ERR_PTR(error);
}

创建文件的权限检查

static int may_o_create(const struct path *dir, struct dentry *dentry, umode_t mode)
{
	struct user_namespace *s_user_ns;

	// 回调 path_mknod 钩子函数
	int error = security_path_mknod(dir, dentry, mode, 0);
	if (error)
		return error;

	s_user_ns = dir->dentry->d_sb->s_user_ns;
	// 检查uid, gid合法性
	if (!kuid_has_mapping(s_user_ns, current_fsuid()) ||
	    !kgid_has_mapping(s_user_ns, current_fsgid()))
		return -EOVERFLOW;

	// 检查当前进程在目标目录的权限
	error = inode_permission(dir->dentry->d_inode, MAY_WRITE | MAY_EXEC);
	if (error)
		return error;

	// 调用 inode_create 钩子函数
	return security_inode_create(dir->dentry->d_inode, dentry, mode);
}

int inode_permission(struct inode *inode, int mask)
{
	int retval;

	// 检查超级块上的权限
	retval = sb_permission(inode->i_sb, inode, mask);
	if (retval)
		return retval;

	if (unlikely(mask & MAY_WRITE)) {
		// 当前目录不可修改
		if (IS_IMMUTABLE(inode))
			return -EPERM;

		// uid或者gid无效
		if (HAS_UNMAPPED_ID(inode))
			return -EACCES;
	}

	retval = do_inode_permission(inode, mask);
	if (retval)
		return retval;

	// todo: cgroup不懂
	retval = devcgroup_inode_permission(inode, mask);
	if (retval)
		return retval;

	// 调用 inode_permission 钩子函数
	return security_inode_permission(inode, mask);
}

static int sb_permission(struct super_block *sb, struct inode *inode, int mask)
{
	if (unlikely(mask & MAY_WRITE)) {
		umode_t mode = inode->i_mode;

		// 如果是只读文件系统,则不允许创建普通文件,目录,软链接
		if (sb_rdonly(sb) && (S_ISREG(mode) || S_ISDIR(mode) || S_ISLNK(mode)))
			return -EROFS;
	}
	return 0;
}

static inline int do_inode_permission(struct inode *inode, int mask)
{
	if (unlikely(!(inode->i_opflags & IOP_FASTPERM))) {
		// 先调用具体文件系统检查权限, 只检查一次
		if (likely(inode->i_op->permission))
			return inode->i_op->permission(inode, mask);

		/* This gets set once for the inode lifetime */
		spin_lock(&inode->i_lock);
		// 写入已检查标志
		inode->i_opflags |= IOP_FASTPERM;
		spin_unlock(&inode->i_lock);
	}
	// 通用权限检查
	return generic_permission(inode, mask);
}

int generic_permission(struct inode *inode, int mask)
{
	int ret;

	// 检查acl权限,一般是selinux
	ret = acl_permission_check(inode, mask);
	if (ret != -EACCES)
		return ret;

	if (S_ISDIR(inode->i_mode)) { // 目录
		// 如果是读,要求有读取,搜索权限
		if (!(mask & MAY_WRITE))
			if (capable_wrt_inode_uidgid(inode,
						     CAP_DAC_READ_SEARCH))
				return 0;
		// todo: 没看懂
		if (capable_wrt_inode_uidgid(inode, CAP_DAC_OVERRIDE))
			return 0;
		// 上面的权限通不过就报错了
		return -EACCES;
	}

	// 下面是普通文件的权限检查

	// 过滤除了读,写,执行的权限
	mask &= MAY_READ | MAY_WRITE | MAY_EXEC;

	// 读 要求有读,执行权能
	if (mask == MAY_READ)
		if (capable_wrt_inode_uidgid(inode, CAP_DAC_READ_SEARCH))
			return 0;
	
	// 下面是写权限检查

	// 如果没有执行标志,或者目录本身对所有人都是可执行的,那要有CAP_DAC_OVERRIDE权能
	if (!(mask & MAY_EXEC) || (inode->i_mode & S_IXUGO))
		if (capable_wrt_inode_uidgid(inode, CAP_DAC_OVERRIDE))
			return 0;

	return -EACCES;
}

与file关联

static int do_open(struct nameidata *nd,
		   struct file *file, const struct open_flags *op)
{
	int open_flag = op->open_flag;
	bool do_truncate;
	int acc_mode;
	int error;

	// 如果没有FMODE_OPENED， FMODE_CREATED标志，则通过complete_walk
	// 完成路径遍历，如果有错误则返回
	if (!(file->f_mode & (FMODE_OPENED | FMODE_CREATED))) {
		error = complete_walk(nd);
		if (error)
			return error;
	}
	// 审计信息
	if (!(file->f_mode & FMODE_CREATED))
		audit_inode(nd->name, nd->path.dentry, 0);
	
	if (open_flag & O_CREAT) { // 如果有创建文件
		// O_EXCL表示检查文件是否存在，如果文件不是新建的,那就表示已经存在,出返回出错
		if ((open_flag & O_EXCL) && !(file->f_mode & FMODE_CREATED))
			return -EEXIST;
		// 如果目标结点是目录，出错。创建目录有专门的系统调用
		if (d_is_dir(nd->path.dentry))
			return -EISDIR;
		// 如果是创建，则检查相应权限
		error = may_create_in_sticky(nd->dir_mode, nd->dir_uid,
					     d_backing_inode(nd->path.dentry));
		if (unlikely(error))
			return error;
	}
	// 如果要求找目录，但是没找到目录，则出错
	if ((nd->flags & LOOKUP_DIRECTORY) && !d_can_lookup(nd->path.dentry))
		return -ENOTDIR;

	do_truncate = false;
	acc_mode = op->acc_mode;
	if (file->f_mode & FMODE_CREATED) {
		// 如果文件已经创建就不再执行O_TRUNC操作
		open_flag &= ~O_TRUNC;
		acc_mode = 0;
	} else if (d_is_reg(nd->path.dentry) && open_flag & O_TRUNC) {
		// 这个分支表示目标是普通文件，而且要求截断

		// 截断时要检查写权限
		error = mnt_want_write(nd->path.mnt);
		if (error)
			return error;
		do_truncate = true;
	}

	// 根据访问文件的要求检查文件权限
	error = may_open(&nd->path, acc_mode, open_flag);
	if (!error && !(file->f_mode & FMODE_OPENED))
		// 如果没有错误，则打开文件，这里打开文件是将file主具体文件系统关联
		error = vfs_open(&nd->path, file);
	if (!error)
		// 静态度量相关检查
		error = ima_file_check(file, op->acc_mode);
	if (!error && do_truncate)
		// 处理截断文件
		error = handle_truncate(file);
	if (unlikely(error > 0)) {
		WARN_ON(1);
		error = -EINVAL;
	}
	// 如果截断了，通知文件系统，丢弃写操作？
	if (do_truncate)
		mnt_drop_write(nd->path.mnt);
	return error;
}

int vfs_open(const struct path *path, struct file *file)
{
	// 设置f_patch，path里有dentry, vfsmount信息
	file->f_path = *path;

	// d_backing_inode实际上获取的就是dentry的inode
	return do_dentry_open(file, d_backing_inode(path->dentry), NULL);
}

static int do_dentry_open(struct file *f,
			  struct inode *inode,
			  int (*open)(struct inode *, struct file *))
{
	static const struct file_operations empty_fops = {};
	int error;

	// 增加path的引用计数
	path_get(&f->f_path);
	
	// 设置inode, i_mapping函数表等信息
	f->f_inode = inode;
	f->f_mapping = inode->i_mapping;
	f->f_wb_err = filemap_sample_wb_err(f->f_mapping);
	f->f_sb_err = file_sample_sb_err(f);

	// todo: 如果是O_PATH，刚直接返回?
	if (unlikely(f->f_flags & O_PATH)) {
		f->f_mode = FMODE_PATH | FMODE_OPENED;
		f->f_op = &empty_fops;
		return 0;
	}

	// 如果要求写，不是特殊文件，则检查用户和文件系统的可写权限
	// 特殊文件指: 字符设备， 块设备， 命名管道，socket
	if (f->f_mode & FMODE_WRITE && !special_file(inode->i_mode)) {
		error = get_write_access(inode);
		if (unlikely(error))
			goto cleanup_file;
		error = __mnt_want_write(f->f_path.mnt);
		if (unlikely(error)) {
			put_write_access(inode);
			goto cleanup_file;
		}
		f->f_mode |= FMODE_WRITER;
	}

	/* POSIX.1-2008/SUSv4 Section XSI 2.9.7 */
	if (S_ISREG(inode->i_mode) || S_ISDIR(inode->i_mode))
		f->f_mode |= FMODE_ATOMIC_POS;

	// 将具体文件系统的操作函数指针与文件关联
	// 这里面就是有open, release, read, write那些函数
	f->f_op = fops_get(inode->i_fop);
	if (WARN_ON(!f->f_op)) {
		error = -ENODEV;
		goto cleanup_all;
	}

	// 调用安全钩子函数
	error = security_file_open(f);
	if (error)
		goto cleanup_all;

	error = break_lease(locks_inode(f), f->f_flags);
	if (error)
		goto cleanup_all;

	// 设置文件的读，写，定位标志
	f->f_mode |= FMODE_LSEEK | FMODE_PREAD | FMODE_PWRITE;

	// 调用具体文件系统的open函数
	if (!open)
		open = f->f_op->open;
	if (open) {
		error = open(inode, f);
		if (error)
			goto cleanup_all;
	}

	// 设置文件已打开标志
	f->f_mode |= FMODE_OPENED;
	// 如果文件只读，增加相应计数器
	if ((f->f_mode & (FMODE_READ | FMODE_WRITE)) == FMODE_READ)
		i_readcount_inc(inode);
	
	// 根据有无读写指针，设置相应的读写标志
	if ((f->f_mode & FMODE_READ) &&
	     likely(f->f_op->read || f->f_op->read_iter))
		f->f_mode |= FMODE_CAN_READ;
	if ((f->f_mode & FMODE_WRITE) &&
	     likely(f->f_op->write || f->f_op->write_iter))
		f->f_mode |= FMODE_CAN_WRITE;

	// todo: write_hint是啥？
	f->f_write_hint = WRITE_LIFE_NOT_SET;

	// 清除文件中的这些标志，这些标志已经没用了
	f->f_flags &= ~(O_CREAT | O_EXCL | O_NOCTTY | O_TRUNC);

	// 初始化预读变量
	file_ra_state_init(&f->f_ra, f->f_mapping->host->i_mapping);

	// 如果是以O_DIRECT打开，但是具体文件系统又不支持这个操作，则出错
	if (f->f_flags & O_DIRECT) {
		if (!f->f_mapping->a_ops || !f->f_mapping->a_ops->direct_IO)
			return -EINVAL;
	}

	// 大页目前还不支持文件写，所以如果是写文件，则丢弃大页里的数据
	if ((f->f_mode & FMODE_WRITE) && filemap_nr_thps(inode->i_mapping))
		truncate_pagecache(inode, 0);

	return 0;

cleanup_all:
	if (WARN_ON_ONCE(error > 0))
		error = -EINVAL;
	fops_put(f->f_op);
	if (f->f_mode & FMODE_WRITER) {
		put_write_access(inode);
		__mnt_drop_write(f->f_path.mnt);
	}
cleanup_file:
	path_put(&f->f_path);
	f->f_path.mnt = NULL;
	f->f_path.dentry = NULL;
	f->f_inode = NULL;
	return error;
}

创建临时文件

static int do_tmpfile(struct nameidata *nd, unsigned flags,
		const struct open_flags *op,
		struct file *file)
{
	struct dentry *child;
	struct path path;
	// 找到父目录
	int error = path_lookupat(nd, flags | LOOKUP_DIRECTORY, &path);
	if (unlikely(error))
		return error;
	// 检查父目录写权限
	error = mnt_want_write(path.mnt);
	if (unlikely(error))
		goto out;
	// 创建dentry, inode
	child = vfs_tmpfile(path.dentry, op->mode, op->open_flag);
	error = PTR_ERR(child);
	if (IS_ERR(child))
		goto out2;
	dput(path.dentry);

	// 设置成刚创建的文件
	path.dentry = child;

	// 打印审计日志
	audit_inode(nd->name, child, 0);
	/* Don't check for other permissions, the inode was just created */

	// 检查打开权限
	error = may_open(&path, 0, op->open_flag);
	if (error)
		goto out2;
	// 设置文件的挂载点指针
	file->f_path.mnt = path.mnt;
	// finish_open 与上面的vfs_open差不多
	error = finish_open(file, child, NULL);
out2:
	mnt_drop_write(path.mnt);
out:
	path_put(&path);
	return error;
}

struct dentry *vfs_tmpfile(struct dentry *dentry, umode_t mode, int open_flag)
{
	struct dentry *child = NULL;
	struct inode *dir = dentry->d_inode;
	struct inode *inode;
	int error;

	// 因为要创建文件，所以要检查在这个目录的写，执行权限
	error = inode_permission(dir, MAY_WRITE | MAY_EXEC);
	if (error)
		goto out_err;
	error = -EOPNOTSUPP;
	// 如果文件系统没有tmpfile这个指针，则不支持临时文件
	if (!dir->i_op->tmpfile)
		goto out_err;
	error = -ENOMEM;

	// 申请一个dentry
	child = d_alloc(dentry, &slash_name);
	if (unlikely(!child))
		goto out_err;
	// 调用具体文件系统创建临时文件
	error = dir->i_op->tmpfile(dir, child, mode);
	if (error)
		goto out_err;
	error = -ENOENT;
	inode = child->d_inode;
	// 创建失败，返回
	if (unlikely(!inode))
		goto out_err;
	// 如果没有O_EXCL标志，则表示文件是可链接的
	if (!(open_flag & O_EXCL)) {
		spin_lock(&inode->i_lock);
		inode->i_state |= I_LINKABLE;
		spin_unlock(&inode->i_lock);
	}
	// 静态度量？
	ima_post_create_tmpfile(inode);
	return child;

out_err:
	dput(child);
	return ERR_PTR(error);
}

用O_PATH方式打开

static int do_o_path(struct nameidata *nd, unsigned flags, struct file *file)
{
	struct path path;
	// 找到父目录dentry
	int error = path_lookupat(nd, flags, &path);
	if (!error) {
		// 审计
		audit_inode(nd->name, path.dentry, 0);
		// 将file与dentry关联
		error = vfs_open(&path, file);
		path_put(&path);
	}
	return error;
}

将file与fd关联

void fd_install(unsigned int fd, struct file *file)
{
	__fd_install(current->files, fd, file);
}

void __fd_install(struct files_struct *files, unsigned int fd,
		struct file *file)
{
	struct fdtable *fdt;

	rcu_read_lock_sched();

	if (unlikely(files->resize_in_progress)) { // files正在扩容
		rcu_read_unlock_sched();
		spin_lock(&files->file_lock);
		fdt = files_fdtable(files);

		// 如果fd对应的文件不为空，那系统就出bug，oops
		BUG_ON(fdt->fd[fd] != NULL);
		// 将file设置为fd对应的位置
		rcu_assign_pointer(fdt->fd[fd], file);
		spin_unlock(&files->file_lock);
		return;
	}
	// 下面是没有扩容的正常路径，大多数情况下走这个路径
	// 将file设置到fd对应的位置
	smp_rmb();
	fdt = rcu_dereference_sched(files->fdt);
	BUG_ON(fdt->fd[fd] != NULL);
	rcu_assign_pointer(fdt->fd[fd], file);
	rcu_read_unlock_sched();
}

你可能感兴趣的:(Kernel,kernel)

pcie bar空间region [disable]无法访问格局视界 PCIE arm开发
现象没有截图，下图[virtual]时需要重启host，为[disable]时可以用解决方案的命令解决方案setpcie-s01:00.0COMMAND=0x02解释thiswillenablememorymappedtransfersforyourpciedevice.In4.8kernelsomethingischanges,sodriversdoesnotenablemmtransfersb
vmware中创建qemu的嵌套虚拟化问题格局视界问题记录 arm开发 fpga开发嵌入式硬件
在qemu启动镜像中有enable-kvm参数时报错：CouldnotaccessKVMkernelmodule:Nosuchfileordirectoryqemu-system-x86_64:failedtoinitializekvm:Nosuchfileordirectory分析：问题发生场景为在虚拟机中嵌套使用虚拟机，因此不光物理机要支持虚拟化，同时虚拟机也要支持虚拟化，即嵌套虚拟化问题。解
（备忘） manjaro更换内核后 virtualBox 中打不开虚拟机（已经解决）波格斯特问题备忘 linux 内核
文章目录问题描述解决办法参考链接1问题描述更换完5.9内核后VirtualBox提示Kerneldrivernotinstalled(rc=-1908)"TheVirtualBoxLinuxkerneldriveriseithernotloadedornotsetupcorrectly.Pleasetrysettingitupagainbyexecuting'/sbin/vboxconfig'as
ubuntu高并发内核参数调优 - （压测客户端调优） sj1163739403 Linux系统 ubuntu
业务上要求集群提供10w+并发，10w+并发听上去不是很难，但10w并发持续1小时呢在业务上线之前还需要我们自己对业务进行压测，俗称benchmark。压测的服务器也是需要进行性能调优的，以下列出调优前后的参数对比，更直观的分析和感受参数对程序的影响压测前内核参数自检#!/bin/bash#脚本名称:check_benchmark_server_kernel_params.sh#描述:查询压测服务
哇！5.2秒进入应用界面！Linux快速启动方案分享，基于全志T113-i国产平台 Tronlong创龙工业级核心板全志T113 嵌入式开发国产ARM 工业核心板
本文主要介绍基于创龙科技TLT113-EVM评估板（基于全志T113-i）的系统快速启动显示Qt界面、LVGL界面案例，适用开发环境如下。Windows开发环境：Windows764bit、Windows1064bit虚拟机：VMware15.5.5Linux开发环境：Ubuntu18.04.464bitU-Boot：U-Boot-2018.07Kernel：Linux-5.4.61、Linux-
Linux Kernel入门到精通系列讲解（RV-Kernel 篇） 5.3 从零移植 busybox，基于RISC-V 嵌入式内核源码 Linux kernel从入门到精通 linux risc-v rootfs qemu kernel 嵌入式芯片
1.概述上一章节我们已经成功启动了Ubuntu，但是由于Ubuntu占用系统空间过大，所以我转向占用较小的busybox,预计就占用30M左右。2.源码下载下载地址3.编译busybox在上一章节中，我们就提到了kernel在启动时会去初始化rootfs，具体为下列四个脚本，如果我们不去写这四个脚本会是什么样呢？如下图，它会不断重复打印log。接下来我们就先去编译busybox。[
Linux运维技术之Linux云计算架构极客事纪 Linux 《Linux一学就会》程序员 linux 运维服务器
我以下图为基础，说明Linux的架构(architecture)。最内层是硬件，最外层是用户常用的应用，比如说firefox浏览器，evolution查看邮件，一个计算流体模型等等。硬件是物质基础，而应用提供服务。但在两者之间，还要经过一番周折。还记得Linux启动。Linux首先启动内核(kernel)，内核是一段计算机程序，这个程序直接管理管理硬件，包括CPU、内存空间、硬盘接口、网络接口等等
pyspark 遇到**Py4JJavaError** Traceback (most recent call last) ~\AppData\ 2pi spark python
Py4JJavaErrorTraceback(mostrecentcalllast)~\AppData\Local\Temp/ipykernel_22732/1401292359.pyin---->1feat_df.show(5,vertical=True)D:\Anaconda3\envs\recall-service-cp4\lib\site-packages\pyspark\sql\data
Linux系统移植篇（七）Linux 内核kernel 启动流程 7yewh 【Linux 系统移植】linux 运维服务器驱动开发
链接脚本vmlinux.lds要分析Linux启动流程，同样需要先编译一下Linux源码，因为有很多文件是需要编译才会生成的。首先分析Linux内核的连接脚本文件arch/arm/kernel/vmlinux.lds，通过链接脚本可以找到Linux内核的第一行程序是从哪里执行的。（跟Uboot启动流程的ids一样）492OUTPUT_ARCH(arm)493ENTRY(stext)494jiffi
【FreeRTOS】FreeRTOS操作系统几种典型的进程间通信方式及使用示例公子无缘嵌入式单片机嵌入式硬件 mcu stm32 rtos
一进程间通信概述FreeRTOS提供了多种进程间通信（IPC）机制，用于任务之间的同步和数据交换。这边列举几个典型的进程间通信机制，包括消息队列、信号量、事件组、任务通知。更多复杂的机制和用法可以参考官方文档：FreeRTOSKernel开发人员文档-FreeRTOS™二消息队列（Queues）【1】概述参考官方文档（FreeRTOS队列-FreeRTOS™）。队列又称消息队列，是一种常用于任务间
tiny linux: 内核精简的根文件系统制作 SunliyMonkey 一一『操作系统』tiny linux qemu busybox 根文件系统
tinylinuxtiny_linux要求实现以下两点：精简linux内核镜像，要求在支持TCP/IP数据传输的情况下，内核镜像和正常运行所需内存能够做到尽可能的小。采用busybox制作根文件系统，利用kernelmodelinux补丁，使得busybox运行在内核态。欢迎访问tiny_linux,这里有编译好的内核镜像，根文件系统镜像以及相关脚本，供大家使用。涉及知识点qemu使用linux内
KVM 内核优化全攻略：全方位释放服务器性能 TechStack 创行者 KVM Linux 服务器运维 KVM
KVM内核优化全攻略：全方位释放服务器性能在云计算、大数据、人工智能等前沿技术蓬勃发展的当下，服务器性能面临着前所未有的挑战。KVM（Kernel-basedVirtualMachine）作为开源虚拟化解决方案，凭借高效稳定的特性，广泛应用于企业数据中心。要充分发挥KVM性能优势，对其内核进行全面优化势在必行。本文将为你详细介绍一套涵盖通用优化及其他关键优化点的完整KVM内核优化方案，并结合实际案
海思 HI 35xx u-boot+kernel+rootfs移植晓鹏-King ARM uboot Linux linux 海思 uboot kernel rootfs
PC端开发环境安装：sudo./sdk.unpack报如下错误：./sdk.unpack:7:./sdk.unpack:WARN:notfound./sdk.unpack:8:./sdk.unpack:ECHO:notfound./sdk.unpack:20:./sdk.unpack:ECHO:notfound./sdk.unpack:22:./sdk.unpack:run_command_pro
Ubuntu 将更改版本规则，使用最新内核发布发行版 CIb0la 树莓派运维程序人生 ubuntu linux
众所周知，Canonical开发的Ubuntu发行版每半年发布一个新版本，而Linux内核却是大约每2-3个月发布一个新版本。这导致一个问题，Ubuntu发行版永远使用的不是最新内核。因为按照Ubuntu的开发周期，Ubuntu开发阶段选择使用的版本到正式发布时肯定已经落后于上游的最新稳定版本。现在CanonicalKernelTeam(CKT)宣布将改变内核选择方法，即在发布冻结日期时采用最新可
ubuntu20.04挂起/休眠后无法唤醒，只能强制重启 koigh ubuntu nvidia
文章目录1、设备信息2、问题描述3、解决思路3.1、禁用挂起功能3.2、降低驱动版本1、设备信息OS:Ubuntu20.04.2LTSx86_64Kernel:5.8.0-63-genericShell:zsh5.8DE:GNOMECPU:Inteli5-6300HQ(4)@3.200GHzGPU:IntelHDGraphics530GPU:NVIDIAGeForceGTX960MNVIDIAVe
linux下消息队列详解 zy20150613 linux linux 消息队列
消息队列提供了从一个进程向另外一个进程发送一块数据的方法，每个数据块认为有一个类型（通俗说法是一个通道），但是接受通道与发送通道必须一致才能实现通信。消息队列的不足之处在于每个消息最大长度有限度，每个消息队列总字节数有限制，系统的消息队列有限制。命令：cat/proc/sys/kernel/msgmax：查看一条信息最大有多大cat/proc/sys/kernel/msgmnb：查看消息队列中信息
安装Docker Desktop报错WSL 2 installation is incomplete(实操教程) By北阳 docker 容器运维
点击运行提示WSL2安装不完整问题描述：WSL2installationisincomplete.TheWSL2LinuxkernelisnowinstalledusingaseparateMSlupdatepackage.Pleaseclickthelinkandfollowtheinstructionstoinstallthekernelupdate:https://aka.ms/wsl2ke
深入解析Linux进程调度器-CPU负载 Linux内核站 linux 运维服务器 Linux内核 CPU负载
说明：Kernel版本：4.14ARM64处理器，Contex-A53，双核使用工具：SourceInsight3.5，Visio1.概述CPU负载（cpuload）指的是某个时间点进程对系统产生的压力。来张图来类比下（参考UnderstandingLinuxCPULoad）CPU的运行能力，就如大桥的通行能力，分别有满负荷，非满负荷，超负荷等状态，这几种状态对应不同的cpuload值；单CPU满
【versal】【petalinux】添加LED驱动 qq2108462953 petalinux linux 运维服务器
versal添加LED驱动`提示：本文使用外部kernel与uboot`一、LED1.1LED功能1.2LED节点1.3LED操作命令1.3.1点LED1.3.2关闭LED二、LED驱动2.1驱动文件2.2设备树兼容属性三、LED设备树配置3.1设备树配置信息3.2设备树配置信息讲解四、提示4.1正确4.2错误4.3提示：本文使用外部kernel与uboot一、LED1.1LED功能向节点中bri
R语言：初始环境配置一头大学牲程序--编程记录 r语言开发语言
文章目录R语言的配置URL和种子R语言的配置在R中安装languageserver包：（直接在R.exe中运行即可）install.packages("languageserver")关于jupyternotebook如何编写R语言：（好像每种jupyternotebook支持的编程语言，解释器都有对应的jupyternotebook）install.packages('IRkernel')IRk
使用yolo训练自己的模型数据遇到的问题次次皮 YOLO 深度学习人工智能
1、报错：NolabelsfoundinD:\xxx\valid\labels.cache查找网上的文章大多都是说文件目录没按规定创建，但我检查了我的目录没问题，后来发现是labels文件夹里的txt文件和images文件夹的图片没有一一对应，对应好之后问题解决2、解决完上个问题之后还是不报上面的错了但还是FatalPythonerror:Aborted；Restartingkernel...检查
KVM安全模块生产环境配置与优化指南 TechStack 创行者 #服务器容器 Linux 服务器运维安全 kvm SELinux
KVM安全模块生产环境配置与优化指南一、引言在当今复杂多变的网络安全环境下，生产环境中KVM（Kernel-basedVirtualMachine）的安全配置显得尤为重要。本指南旨在详细阐述KVM安全模块的配置方法，结合强制访问控制（MAC）、硬件隔离及合规性要求，为您提供全面且深入的操作建议，确保KVM环境的安全性和稳定性。二、SELinux安全模块配置1.基础策略配置SELinux（Secur
Centos安装GPU驱动,使用100元显卡玩转deepseek white.tie centos linux 运维
步骤1:安装NVIDIA驱动程序1.1安装显卡驱动编译工具yuminstallgccmakekernel-devel1.2安装显卡驱动依赖包yuminstallvulkan-loader1.3下载驱动安装https://www.nvidia.cn/drivers/details/220730/chmodu+xNVIDIA-Linux-x86_64-550.54.15.run./NVIDIA-Lin
嵌入式面试真题——Linux内核空间与用户空间 70000cc 嵌入式面试真题 linux c语言嵌入式硬件面试单片机
本文以32位系统为例介绍内核空间(kernelspace)和用户空间(userspace)。对32位操作系统而言，它的寻址空间（虚拟地址空间，或叫线性地址空间）为4G（2的32次方）。也就是说一个进程的最大地址空间为4G。操作系统的核心是内核(kernel)，它独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的所有权限。为了保证内核的安全，现在的操作系统一般都强制用户进程不能直
卷积神经网络可视化天行者@ cnn 人工智能神经网络
卷积神经网络（CNN）的可视化是理解模型行为、调试性能和解释预测结果的重要工具。以下从技术原理、实现方法和应用场景三个维度，系统梳理CNN可视化的核心技术，并提供代码示例和前沿方向分析：一、CNN可视化的核心维度1.卷积核可视化原理：提取卷积层的权重，将其转换为图像形式，观察滤波器学习到的模式。实现步骤：提取卷积层权重（形状为[out_channels,in_channels,kernel_siz
Linux 下卸载MySQL 5 weixin_34015336 数据库
对于在Linux下通过rpm方式的mysql，我们能够通过移除这些rpm包以及删除项目的文件夹来达到卸载的目的。本文演示了在SUSELinux10下下载MySQL5.5.37。详细见下文。1、环境#OS环境SZDB:~#cat/etc/issueWelcometoSUSELinuxEnterpriseServer10SP3(x86_64)-Kernel\r(\l).#查看已安装的安装包SZDB:~
基于CATIA VBA与Python的自动化音乐生成技术对比研究 Python×CATIA工业智造 python 开发语言 CATIA二次开发
在工程软件二次开发领域，CATIA也可以许多另类的玩法。通过CATIA自带的VBA可以演奏歌曲，但实际效果往往差强人意。为了进一步优化实际演奏效果，本文以自动生成林宥嘉《说谎》钢琴前奏旋律为案例，探讨两种语言在多媒体控制领域的技术实现差异。一、CATIAVBA实现：极简音频方案1.1技术原理PrivateDeclarePtrSafeFunctionBeepLib"kernel32"(ByValdw
windows 内核层简单 map 实现与测试爱学习的大牛123 windows驱动内核开发 map windows内核
KernelDataStructs.h#pragmaonce#pragmaonce#include//内存标签定义#defineKERNEL_MAP_TAG'KMap'#defineKERNEL_VECTOR_TAG'KVec'//安全内存分配宏#defineSAFE_ALLOC(ptr,size,tag)\(ptr)=ExAllocatePoolWithTag(NonPagedPoolNx,(s
Linux系统移植 —— Kernel编译、安装、开发 Fang- Linux学习笔记 linux 系统移植内核移植内核编译安装
=======================1Linux内核配置与编译=======================一、清除临时文件、中间文件、配置文件makeclean清除编译生成的文件，保留配置文件makemrproper清除编译生成的文件和配置文件makedistclean清除所有文件二、配置内核一般会以一个参考的配置文件（如：arch/arm/），在该文件基础上进行配置。makeconf
AKI跨语言调用库让C/C++代码迁移至HarmonyOS NEXT更高效 harmonyos
AKI跨语言调用库神助攻C/C++代码迁移至HarmonyOSNEXT随着HarmonyOSNEXT的发布，越来越多的应用加速推进鸿蒙化。在这一过程中，如何高效迁移原有资产、简化跨语言调用，成为开发者和厂商面临的重要挑战。为解决这一痛点，一款名为AKI(AlphaKernelInteracting)的开源三方库应运而生，它通过高效封装跨语言调用接口，帮助开发者将C/C++代码快速迁移至Harmon
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s