使用cat读取和echo写内核文件节点的一些问题--688IT编程网

使⽤cat读取和echo写内核⽂件节点的⼀些问题

平台：

busybox-1.24.2

Linux-4.10.17

Qemu+vexpress-ca9

概述：

在写驱动的时候，我们经常会向⽤户空间导出⼀些⽂件，然后⽤户空间使⽤cat命令去读取该节点，从⽽完成kernel跟user的通信。但是有时会发现，如果节点对应的read回调函数写的有问题的话，使⽤cat命令后，节点对应的read函数会被频繁调⽤，log直接刷屏，⽽我们只希望read被调⽤⼀次，echo也是⼀样的道理。背后的原因是什么呢？如何解决呢？下⾯我们以debugfs下的节点读写为例说明⼀下。

正⽂：

⼀、read和write的介绍：

1、系统调⽤read

ssize_t read(int fd, void *buf, size_t count);

这个函数会从fd表⽰的⽂件描述符中读取count个字节到buf缓冲区当中，返回值有下⾯⼏种：

如果返回值⼤于0，表⽰实际读到的字节数，返回0的话，表⽰读到了⽂件结尾，同时⽂件的file position也会被更新。实际读到的字节数可能会⽐count⼩。如果返回-1，表⽰读取失败，errno会被设置为相应的值。

2、系统调⽤write

ssize_t write(int fd, const void *buf, size_t count);

这个函数将以buf为⾸地址的缓冲区当中的count个字节写到⽂件描述符fd表⽰的⽂件当中，返回值：返回正整数，表⽰实际写⼊的字节数，返回0表⽰没有任何东西被写⼊，同时⽂件位置指针也会被更新返回-1，表⽰写失败，同时errno会被设置为相应的值。

3、LDD3上对驱动中实现的read回调函数的解释

原型：ssize_t (*read) (struct file *fp, char __user *user_buf, size_t count, loff_t *ppos);

fp：被打开的节点的⽂件描述符；

user_buf：表⽰的是⽤户空间的⼀段缓冲区的⾸地址，从kernel读取的数据需要存放该缓冲区当中

count：表⽰⽤户期望读取的字节数；

*ppos：表⽰当前当前⽂件位置指针的⼤⼩，这个值会需要驱动程序⾃⼰来更新，初始⼤⼩是0。

如果返回值等于传递给read系统调⽤的count参数，则说明所请求的字节数传输成功完成。这是最理想的情况。

如果返回值是正的，但是⽐count⼩，则说明只有部分数据传输成功。这种情况下因设备的不同可能有许多原因。⼤部分情况下，程序会再次读数据。例如，如果⽤fread函数读数据，这个库函数就会不断调⽤系统调⽤，直⾄所请求的数据传输完毕为⽌。

如果返回值为0，则表⽰已经达到了⽂件尾。

负值意味着发⽣了错误，该值指明了发⽣了什么错误，错误码在<linux/errno.h>中定义。⽐如这样的⼀些错误：-EINTR(系统调⽤被中断)或者-EFAULT(⽆效地址)。

4、LDD3上对驱动中实现的write回调函数的解释

原型：ssize_t (*write) (struct file *fp, const char __user *user_buf, size_t count, loff_t *ppos);

fp：被打开的要写的内核节点的⽂件描述符；

user_buf：表⽰的是⽤户空间的⼀段缓冲区的⾸地址，其中存放的是⽤户需要传递给kernel的数据；

count：⽤户期望写给kernel的字节数；

*ppos：⽂件位置指针，需要驱动程序⾃⼰更新。

如果返回值等于count，则完成了所请求数⽬的字节传输。

如果返回值为正的，但⼩于count，则这传输了部分数据。程序很可能再次试图写⼊余下的数据。

如果返回值为0，意味着什么也没有写⼊。这个结果不是错误，⽽且也没有理由返回⼀个错误码。再次重申，标准库会重复调⽤write。负值意味着发⽣了错误，与read相同，有效的错误码定义在<linux/errno.h>中。

上⾯加粗的红⾊字体引起驱动中的write或者read被反复调⽤的原因。

⼆、简略的分析⼀下read和write系统调⽤的实现

在⽤户空间调⽤read函数后，内核函数vfs_read会被调⽤：

ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)

{

ssize_t ret;

if (!(file->f_mode & FMODE_READ))

return -EBADF;

if (!(file->f_mode & FMODE_CAN_READ))

return -EINVAL;

if (unlikely(!access_ok(VERIFY_WRITE, buf, count)))

return -EFAULT;

ret = rw_verify_area(READ, file, pos, count);

if (!ret) {

if (count > MAX_RW_COUNT)

count = MAX_RW_COUNT;

ret = __vfs_read(file, buf, count, pos);

if (ret > 0) {

fsnotify_access(file);

add_rchar(current, ret);

}

inc_syscr(current);

}

return ret;

linux怎么读文件内容

}

下⾯是需要关注的：

第9⾏检查⽤户空间的buf缓冲区是否可以写⼊。

第14⾏检查count的⼤⼩，这⾥MAX_RW_COUNT被设置为1个页的⼤⼩，这⾥的值是4KB，也就是⼀次⽤户⼀次read最多获得4KB数据。

第16⾏调⽤__vfs_read，这个函数最终会调⽤到我们的驱动中的read函数，可以看到这个函数的参数跟驱动中的read函数⼀样，驱动中read返回的数字ret会返回给⽤户，这⾥并没有看到更新pos，所以需要在我们的驱动中⾃⼰去更新。

⽤户空间调⽤write函数后，内核函数vfs_write会被调⽤：

ssize_t vfs_write(struct file *file, const char __user *buf, size_t count, loff_t *pos)

{

ssize_t ret;

if (!(file->f_mode & FMODE_WRITE))

return -EBADF;

if (!(file->f_mode & FMODE_CAN_WRITE))

return -EINVAL;

if (unlikely(!access_ok(VERIFY_READ, buf, count)))

return -EFAULT;

ret = rw_verify_area(WRITE, file, pos, count);

if (!ret) {

if (count > MAX_RW_COUNT)

count = MAX_RW_COUNT;

file_start_write(file);

ret = __vfs_write(file, buf, count, pos);

if (ret > 0) {

fsnotify_modify(file);

add_wchar(current, ret);

}

inc_syscw(current);

file_end_write(file);

}

return ret;

}

这⾥需要关注:

第9⾏，检查⽤户空间的缓冲区buf是否可以读。

第15⾏，限制⼀次写⼊的数据最多为1页，⽐如4KB。

第17⾏的_vfs_write的参数跟驱动中的write的参数⼀样，__vfs_write的返回值ret也就是⽤户调⽤write时的返回值，表⽰实际写⼊的字节数，这⾥也没有看到更新pos的代码，所以需要我们⾃⼰在驱动的write中实现。

三、简略分析cat和echo的实现

由于使⽤的根⽂件系统使⽤busybox做的，所以cat和echo的实现在busybox的源码中，如下：

coreutils/cat.c

coreutils/echo.c

CAT：

下⾯简略分析cat的实现，cat的默认实现采⽤了sendfile，采⽤sendfile可以减少不必要的内存拷贝，从⽽提⾼读写效率，这就是所谓的Linux的“零拷贝”。为了便于代码分析，可以关闭这个功能，然后cat就会调⽤read和write实现了：

Busybox Settings --->

General Configuration --->

[ ] Use sendfile system call

下⾯是cat的核⼼函数：

以cat xxx为例其中src_fd就是被打开的内核节点的⽂件描述符，dst_fd就是标准输出描述符，size是0。

static off_t bb_full_fd_action(int src_fd, int dst_fd, off_t size)

{

int status = -1;

off_t total = 0;

bool continue_on_write_error = 0;

ssize_t sendfile_sz;

char buffer[4 * 1024]; // ⽤户空间缓冲区，4KB⼤⼩

enum { buffer_size = sizeof(buffer) }; // 每次read期望获得的字节数

sendfile_sz = 0;

if (!size) {

size = (16 * 1024 *1024); // 刚开始，如传⼊的size是0，这⾥将size设置为16MB

status = 1; /* 表⽰⼀直读到⽂件结尾，也就是直到read返回0 */

}

while (1) {

ssize_t rd;

rd = safe_read(src_fd, buffer, buffer_size); // 这⾥调⽤的就是read, 读取4KB，rd是实际读到的字节数

if (rd < 0) {

bb_perror_msg(bb_msg_read_error);

break;

}

read_ok:

if (!rd) { /* 表⽰读到了⽂件结尾，那么结束循环 */

status = 0;

break;

}

/* 将读到的内容输出到dst_fd表⽰的⽂件描述符 */

if (dst_fd >= 0 && !sendfile_sz) {

ssize_t wr = full_write(dst_fd, buffer, rd);

if (wr < rd) {

if (!continue_on_write_error) {

bb_perror_msg(bb_msg_write_error);

break;

}

dst_fd = -1;

}

total += rd; // total记录的是读到的字节数的累计值

if (status < 0) { /* 如果传⼊的size不为0，那么status为-1，直到读到size个字节后，才会退出。如果size为0，这个条件不会满⾜ */

size -= rd;

if (!size) {

/* 'size' bytes copied - all done */

status = 0;

break;

}

out:

return status ? -1 : total; // 当读完毕，status为0，这⾥返回累计读到的字节数

}

从上⾯的分析我们知道如下信息：

使⽤cat xxx时，上⾯的函数传⼊的size为0，那么上⾯的while循环会⼀直进⾏read，直到出错或者read返回0，read返回0也就是读到⽂件结尾。最后如果出错，那么返回-1，否则的话，返回读到的累计的字节数。

到这⾥，应该就是知道为什么驱动中的read会被频繁调⽤了吧，也就是驱动中的read的返回值有问题。

ECHO：

echo的核⼼函数是full_write；

这⾥fd是要写的内核节点，buf缓冲区中存放的是要写⼊的内容，len是buf缓冲区中存放的字节数。

ssize_t FAST_FUNC full_write(int fd, const void *buf, size_t len)

{

ssize_t cc;

ssize_t total;

total = 0;

while (len) {

cc = safe_write(fd, buf, len);

if (cc < 0) {

if (total) {

/* we already wrote some! */

/* user can do another write to know the error code */

return total;

}

return cc; /* write() returns -1 on failure. */

}

total += cc;

buf = ((const char *)buf) + cc;

len -= cc;

}

return total;

}

上⾯的函数很简单，可以得到如下信息：

如果write的函数返回值cc⼩于len的话，会⼀直调⽤write，直到报错或者len个字节全部写完。⽽这⾥的cc对应的就是我们的驱动中write的返回值。最后，返回实际写⼊的字节数或者⼀个错误码。

到这⾥，应该也已经清除为什么调⽤⼀次echo后，驱动的write为什么会被频繁调⽤了吧，还是驱动中write的返回值的问题。

知道的上⾯的原因，下⾯我们结合⼀个简单的驱动看看。

四、实例分析

1、先看两个刷屏的例⼦

这个驱动在/sys/kernel/debug⽣成⼀个demo节点，⽀持读和写。

#include <linux/init.h>

#include <linux/module.h>

#include <linux/debugfs.h>

#include <linux/fs.h>

#include <asm/uaccess.h>

static struct dentry *demo_dir;

static ssize_t demo_read(struct file *fp, char __user *user_buf, size_t count, loff_t *ppos)

{

char kbuf[10];

int ret, wrinten;

printk(KERN_INFO "user_buf: %p, count: %d, ppos: %lld\n",

user_buf, count, *ppos);

wrinten = snprintf(kbuf, 10, "%s", "Hello");

ret = copy_to_user(user_buf, kbuf, wrinten+1);

if (ret != 0) {

printk(KERN_ERR "read error");

return -EIO;

}

*ppos += wrinten;

688IT编程网

使用cat读取和echo写内核文件节点的一些问题

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

使用cat读取和echo写内核文件节点的一些问题

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法