Chinaunix

标题: 创建proc项,write函数调用copy_from_user读取换行符的疑问 [打印本页]

作者: superwujc    时间: 2017-03-29 16:24
标题: 创建proc项,write函数调用copy_from_user读取换行符的疑问
请教各位

在/proc下创建了一个测试文件,并手动指定了write回调函数,write中调用copy_from_user,将输入在proc文件中的内容写入到内核空间
现在的问题是,如果proc文件中包含换行符时,copy_from_user会对内容分段写入多次

程序:proc_rw.c

  1. #include <linux/module.h>
  2. #include <linux/kernel.h>
  3. #include <linux/proc_fs.h>
  4. #include<linux/sched.h>
  5. #include <asm/uaccess.h>
  6. #include <linux/slab.h>
  7. #include <linux/string.h>

  8. int len,temp;
  9. char *msg;

  10. int read_proc(struct file *filp,char *buf,size_t count,loff_t *offp)
  11. {
  12.         if(count>temp)
  13.         {
  14.                 count=temp;
  15.         }
  16.         temp=temp-count;
  17.         printk("read\n");
  18.         printk("count = %d\n", count);
  19.         printk("strlen(msg) = %d\n", strlen(msg));
  20.         copy_to_user(buf,msg, count);
  21.         if(count==0)
  22.                 temp=len;

  23.         return count;
  24. }

  25. int write_proc(struct file *filp,const char *buf,size_t count,loff_t *offp)
  26. {
  27.         if (copy_from_user(msg,buf,count))
  28.                 return -EFAULT;

  29.         len=count;
  30.         temp=len;
  31.         printk("write\n");
  32.         printk("count = %d\n", count);
  33.         printk("strlen(msg) = %d\n", strlen(msg));

  34.         return count;
  35. }

  36. struct file_operations proc_fops = {
  37.         read: read_proc,
  38.         write: write_proc
  39. };

  40. void create_new_proc_entry()
  41. {
  42.         proc_create("hello",0,NULL,&proc_fops);
  43.         msg=kmalloc(GFP_KERNEL,10*sizeof(char));
  44. }

  45. int proc_init (void) {
  46.         create_new_proc_entry();
  47.         return 0;
  48. }

  49. void proc_cleanup(void) {
  50.         remove_proc_entry("hello",NULL);
  51. }

  52. MODULE_LICENSE("GPL");
  53. module_init(proc_init);
  54. module_exit(proc_cleanup);
复制代码
Makefile

  1. obj-m += proc_rw.o
  2. KDIR := /lib/modules/$(shell uname -r)/build
  3. PWD := $(shell pwd)
  4.     EXTRA_CFLAGS = -g -O0 -std=gnu99 -Wno-declaration-after-statement
  5. all:
  6.     make -C $(KDIR) M=$(PWD) modules
  7.     rm -rf *.ko.unsigned *.mod.c *.mod.o *.symvers *.o
  8. .PHONY: clean
  9. clean:
  10.     make -C $(KDIR) M=$(PWD) clean
复制代码
make并insmod

写入后查看内容
  1. echo -ne "a b c" > /proc/hello
复制代码
  1. # cat /proc/hello
  2. a b c
复制代码
写入包含换行符的字符序列
  1. echo -ne "a b c\td \ne   f" > /proc/hello
复制代码
  1. # cat /proc/hello
  2. e   f
复制代码
请各位大神指点一下,怎样copy_from_user()一次读取包含换行符的字符序列


作者: nuclearxin    时间: 2017-03-29 18:39
这个不是 copy_from_user 的问题。你的count 会在遇到回车的时候 设置,cut 然后进入下一轮的write.

所以我建议想要达到你说的效果,请仿照 dmesg  使用的 ring buff  的数据结构 来 代替 msg。

两个指针一个负责写。一个负责读取就好了。。

作者: superwujc    时间: 2017-03-30 10:09
回复 2# nuclearxin

感谢楼上,请教几个问题

write回调函数的buffer是用户内存空间,但我在内核源码中并未找到分配该内存空间的代码
如果count参数以'\n'计数,那么怎样改变这种行为?

proc的read与write,buffer都是在对proc文件读取和写入时自动分配的,怎样使用手动指定的缓冲区?

作者: superwujc    时间: 2017-03-30 10:19
回复 2# nuclearxin

再次请教,

a个'\n'会把输入分割成a+1段,write随之被调用了a+1次,因而读取时,read也被调用a+1次
在write的起始部分,copy_from_user调用之前,打印一下user buffer的长度,会观察到这种行为
  1. int write_proc(struct file *filp,const char *buf,size_t count,loff_t *offp)
  2. {
  3.     printk("buf size: %d\n", strlen_user(buf));
  4.     if (copy_from_user(msg,buf,count))
  5.         return -EFAULT;

  6.     len=count;
  7.     temp=len;
  8.     printk("write\n");
  9.     printk("count = %d\n", count);
  10.     printk("strlen(msg) = %d\n", strlen(msg));

  11.     return count;
  12. }
复制代码
  1. echo -ne "a b c\td \ne   f" > /proc/hello
复制代码
  1. # dmesg
  2. [76143.461257] buf size: 1613
  3. [76143.461261] write
  4. [76143.461262] count = 9
  5. [76143.461262] strlen(msg) = 16
  6. [76143.461268] buf size: 1613
  7. [76143.461269] write
  8. [76143.461270] count = 5
  9. [76143.461270] strlen(msg) = 16
复制代码
  1. cat /proc/hello
  2. e   f
复制代码
  1. # dmesg
  2. [76143.461257] buf size: 1613
  3. [76143.461261] write
  4. [76143.461262] count = 9
  5. [76143.461262] strlen(msg) = 16
  6. [76143.461268] buf size: 1613
  7. [76143.461269] write
  8. [76143.461270] count = 5
  9. [76143.461270] strlen(msg) = 16
  10. [76157.239084] read
  11. [76157.239088] count = 5
  12. [76157.239090] strlen(msg) = 16
  13. [76157.239102] read
  14. [76157.239103] count = 0
  15. [76157.239104] strlen(msg) = 16
复制代码


作者: nuclearxin    时间: 2017-03-30 10:25
回复 3# superwujc

内核空间的内存 要额外小心分配。和用户空间内存随意分配不一样。
count的机制 我不建议你去修改。  工作方式很合理你改这里就是坑。会影响其他所有proc下的文件类的行为。

还是申请的 circular buff 环形链表  作为固定 大小 内存来使用吧。

等我有空写下




作者: nuclearxin    时间: 2017-03-30 10:30
superwujc 发表于 2017-03-30 10:19
回复 2# nuclearxin

再次请教,

没看懂你请教什么 了。

你的这个code 在 write的时候会执行很多次。 只保留最后一次的 len 和buff 的内容

然后你的读取只运行1次啊。 所以只打最后一次write进来的内容。

作者: superwujc    时间: 2017-03-30 10:40
回复 6# nuclearxin

read和write调用的次数是一样的,只不过最后一次read出来的内容把前面的覆盖掉了

  1. [76143.461257] buf size: 1613
  2. [76143.461261] write
  3. [76143.461262] count = 9
  4. [76143.461262] strlen(msg) = 16
  5. [76143.461268] buf size: 1613
  6. [76143.461269] write
  7. [76143.461270] count = 5
  8. [76143.461270] strlen(msg) = 16
  9. [76157.239084] read
  10. [76157.239088] count = 5
  11. [76157.239090] strlen(msg) = 16
  12. [76157.239102] read
  13. [76157.239103] count = 0
  14. [76157.239104] strlen(msg) = 16
复制代码
cat文件然后dmesg
  1.     printk("read\n");
  2.     printk("count = %d\n", count);
  3.     printk("strlen(msg) = %d\n", strlen(msg));
复制代码
这段read函数中的代码被执行了2次,因为打印了2次

write被执行多次是因为user buf中的'\n'把输入在proc文件中的内容分割成多段,所以copy_from_user复制了多次user buf到kernel buf
read被执行多次是因为write被执行了多次,因而copy_to_user向user buf复制了多次


作者: nuclearxin    时间: 2017-03-30 10:50
superwujc 发表于 2017-03-30 10:40
回复 6# nuclearxin

read和write调用的次数是一样的,只不过最后一次read出来的内容把前面的覆盖掉了

read 被执行量2次 是cat  读完一行会尝试在读一次。

你的write会不断的使用\n分割的内容  不断重复覆盖 buff  和len。

你自己测试下

你可以连续 echo 不带 \n的 字符 然后最后cat 下看看是不是只触发上面的2次 read。



作者: nuclearxin    时间: 2017-03-30 10:51
本帖最后由 nuclearxin 于 2017-03-30 13:07 编辑
superwujc 发表于 2017-03-30 10:40
回复 6# nuclearxin

read和write调用的次数是一样的,只不过最后一次read出来的内容把前面的覆盖掉了

确实 挺像 描述的行为。  太巧了

作者: superwujc    时间: 2017-03-30 13:08
回复 9# nuclearxin

so问题来了

如果proc的user buf包含换行符,write怎样一次性全部把这些内容写入到内核空间?

求教


作者: nuclearxin    时间: 2017-03-30 13:18
回复 10# superwujc

。。。请看5楼。啊 自己实现。
不确定使用空间大小的安全做法就是使用 环形链表。







作者: superwujc    时间: 2017-03-30 13:25
回复 11# nuclearxin

刚才搞错了,其实任何情况下,read都会执行2次的,最后一次读取遇到EOF,返回0
  1. echo -ne "a b c \n d e \n f \n gh \n wxyz" > /proc/hello
  2. [root@super memory]# cat /proc/hello
  3. wxyz[root@super memory]# dmesg
  4. [87130.808871] buf size: 1613
  5. [87130.808875] write
  6. [87130.808876] count = 7
  7. [87130.808877] strlen(msg) = 16
  8. [87130.808881] buf size: 1613
  9. [87130.808882] write
  10. [87130.808883] count = 6
  11. [87130.808883] strlen(msg) = 16
  12. [87130.808887] buf size: 1613
  13. [87130.808888] write
  14. [87130.808889] count = 4
  15. [87130.808889] strlen(msg) = 16
  16. [87130.808894] buf size: 1613
  17. [87130.808894] write
  18. [87130.808895] count = 5
  19. [87130.808896] strlen(msg) = 16
  20. [87130.808901] buf size: 1613
  21. [87130.808901] write
  22. [87130.808902] count = 5
  23. [87130.808903] strlen(msg) = 16
  24. [87134.014814] read
  25. [87134.014819] count = 5
  26. [87134.014820] strlen(msg) = 16
  27. [87134.014840] read
  28. [87134.014841] count = 0
  29. [87134.014842] strlen(msg) = 16
复制代码

write会把user buf中最后一个'\n'之后的内容实际写入,覆盖掉'\n'之前的内容
所以read会返回最后一个'\n'之后的内容


另外,ring buf可有样例供参考?多谢


作者: superwujc    时间: 2017-03-30 13:49
本帖最后由 superwujc 于 2017-03-30 13:51 编辑

回复 11# nuclearxin

哈喽,proc的文件内容操作函数是固定的,read和write的原型也是内核定义好的,换言之,写死的
  1. const struct file_operations *proc_fops;
复制代码
  1. ssize_t (*read) (struct file *file, char __user *buf, size_t count, loff_t *offset);
  2. ssize_t (*write) (struct file *file, const char __user *buf, size_t count, loff_t *offset);
复制代码

read从file中读取count字节到buf中,并更新offset
write将buf中的count字节写入到file中,并更新offset
buffer都在用户空间

问下环形缓冲区在这怎么用?

作者: nuclearxin    时间: 2017-03-30 14:09
你想复杂了。不会修改任何 内核机制啊。修改你的module code。一会我写个。
作者: nuclearxin    时间: 2017-03-30 14:09
你想复杂了。不会修改任何 内核机制啊。修改你的module code。一会我写个。
作者: nuclearxin    时间: 2017-03-30 14:10
你想复杂了。不会修改任何 内核机制啊。修改你的module code。一会我写个。
作者: superwujc    时间: 2017-03-30 14:33
回复 16# nuclearxin


给力大神,有劳有劳

作者: nuclearxin    时间: 2017-03-31 14:08
本帖最后由 nuclearxin 于 2017-03-31 14:23 编辑
  1. 有点问题
复制代码

作者: nuclearxin    时间: 2017-03-31 14:09
本帖最后由 nuclearxin 于 2017-03-31 14:31 编辑
  1. linux-mkov:~/jerry # cat hh.c
  2. #include <linux/module.h>
  3. #include <linux/mm.h>
  4. #include <linux/gfp.h>
  5. #include <linux/kernel.h>
  6. #include <linux/proc_fs.h>
  7. #include <asm/uaccess.h>
  8. #include <linux/slab.h>
  9. #include <linux/string.h>



  10. struct cir_list {
  11.   unsigned int num ;
  12.   struct list_head * cir_entry ;
  13.   struct list_head * write;
  14.   struct list_head * read;
  15. };

  16. struct cir_node {
  17.   struct list_head list;
  18.   int w_off_set ;
  19.   int r_off_set ;
  20.   char * buff ;
  21.   int ok ;
  22. };

  23. struct cir_list * jerry;


  24. int add_node (struct cir_list *c, struct cir_node * n)
  25. {
  26.   if(c == NULL) return 0;
  27.   if(n == NULL) return 0;


  28.   if(c->cir_entry == NULL){
  29.     c->cir_entry = &n->list;
  30.     c->write = &n->list;
  31.     c->read = &n->list;
  32.     printk("create the first node\n");
  33.     return 1;
  34.   }else {
  35.     printk("add the new node to the list\n");
  36.     list_add(&n->list,c->cir_entry);
  37.     c->num +=1;
  38.     printk("the num of c %d \n", c->num);
  39.     return 1;
  40.   }

  41. }

  42. struct cir_list * gen_cir(int n){

  43.   struct cir_list * hello_list;

  44.   hello_list = kmalloc(sizeof(struct cir_list),GFP_KERNEL);

  45.   if(hello_list == NULL){
  46.     return NULL;
  47.   }
  48.   //init the list
  49.   hello_list->cir_entry = NULL;
  50.   hello_list->write = NULL;
  51.   hello_list->num = 0;
  52.   hello_list->read = NULL;

  53.   struct cir_node * hello_node;
  54.   int i;
  55.   
  56.   printk("start to generate nodes  in total %d \n",n);

  57.   for(i=0;i<n;i++){
  58.     printk("start to generate %d \n",i);
  59.     hello_node = kmalloc(sizeof(struct cir_node),GFP_KERNEL);
  60.     if(hello_node == NULL) {
  61.       printk("not enough mem\n");
  62.      //TO DO #free all the node already allocated;
  63.       return NULL;
  64.     }
  65.     //init the node
  66.     hello_node->list.next = &hello_node->list;
  67.     hello_node->list.prev = &hello_node->list;
  68.     hello_node->w_off_set = 0;
  69.     hello_node->r_off_set = 0;
  70.     hello_node->buff = get_zeroed_page(GFP_KERNEL);
  71.     hello_node->ok = 1;
  72.     printk("start to generate %d  add_node func\n",i);
  73.     add_node(hello_list,hello_node);
  74.   }

  75.   return hello_list;

  76. }


  77. void clean_list_node(struct cir_list * c)
  78. {
  79.   struct cir_node * n;
  80.   struct list_head * l;
  81.   printk("start to free\n");

  82.   list_for_each(l,c->cir_entry) {
  83.     printk("in for each loop free\n");
  84.     n = list_entry(l, struct cir_node, list);
  85.     if(n==NULL) return;
  86.     free_page(n->buff);
  87.     printk("in for each loop free free_page\n");
  88.     kfree(n);
  89.     printk("in for each loop free node\n");
  90.   }

  91.   printk("out for each loop free list\n");

  92.   //free the head
  93.   printk("free the head \n");
  94.   n = list_entry(c->cir_entry, struct cir_node, list);
  95.   free_page(n->buff);
  96.   printk("head free_page\n");
  97.   kfree(n);
  98.   printk("head node\n");
  99.   kfree(c);
  100.   printk("free the list descriptor\n");
  101. }


  102. void write_end(char * buff ,size_t count ,struct cir_list * l )
  103. {

  104.   printk("----------------------------------start write--------------------------------\n" );

  105.   unsigned int done=0;
  106.   unsigned int left_sp_node;
  107.   struct cir_node * t_node;
  108.   t_node = list_entry(l->write,struct cir_node,list);
  109.   left_sp_node = 4096 - t_node->w_off_set;
  110.   printk("the left space : %d , woffset : %d\n",left_sp_node,t_node->w_off_set );
  111.   
  112.   while(count > left_sp_node){
  113.   
  114.       printk("----------------------------------loops--------------------------------\n" );
  115.       printk(" value lengh %d is bigger than left space %d\n",count,left_sp_node);
  116.       copy_from_user(t_node->buff + t_node->w_off_set,buff+done,left_sp_node);
  117.       printk(" count %d is decrease space\n",count,left_sp_node);
  118.       count -= left_sp_node;   
  119.       t_node->w_off_set += left_sp_node;
  120.       done += left_sp_node;
  121.       t_node = list_entry(t_node->list.next,struct cir_node,list);
  122.       t_node->r_off_set = 0;
  123.       t_node->w_off_set = 0;
  124.       left_sp_node = 4096 - t_node->w_off_set;
  125.       printk("----------------------------------loope--------------------------------\n" );
  126.    
  127.   }
  128.   
  129.   printk(" value length %d is small than left space %d\n",count,left_sp_node);
  130.   printk(" --start to append value %d  at offset %d---\n",count,t_node->w_off_set );
  131.   copy_from_user(t_node->buff + t_node->w_off_set,buff+done,count);
  132.   t_node->w_off_set += count;
  133.   done += count;
  134.   printk(" finshed append %d , all done is %d in this time\n",count,done);
  135.   l->write = &t_node->list;
  136.   printk("----------------------------------end--------------------------------\n" );
  137.   return 1;
  138.   
  139. }

  140. int read_to_write (struct cir_list * l,char * buff,size_t count)
  141. {
  142.   
  143.   struct cir_node * t_node;
  144.   int o_left;

  145.   t_node = list_entry(l->read,struct cir_node,list);
  146.   
  147.   if(l->read != l->write){
  148.     printk("cross read\n");

  149.     o_left = 4096 - t_node->r_off_set;
  150.     printk("cross read this node have left %d , the request count is %d \n",o_left,count);

  151.     printk("cross area read  woffset : %d , roffset : %d \n",t_node->w_off_set,t_node->r_off_set);
  152.     if(count <= o_left){
  153.       printk("cross read count is <= o_left \n");
  154.       copy_to_user(buff,t_node->buff + t_node->r_off_set,count);
  155.       printk("cross area read  copy to user %d \n",count);
  156.       t_node->r_off_set += count;
  157.       return count;
  158.     }else{
  159.       copy_to_user(buff ,t_node->buff + t_node->r_off_set,o_left);
  160.       t_node->r_off_set = 4096;
  161.       t_node = list_entry(t_node->list.next,struct cir_node,list);
  162.       l->read  = &t_node->list;
  163.       return o_left;
  164.     }

  165.   } else {

  166.     printk("same area read\n");
  167.     o_left = t_node->w_off_set - t_node->r_off_set;
  168.     printk("same area read  woffset : %d , roffset : %d \n",t_node->w_off_set,t_node->r_off_set);
  169.     if(o_left==0) return 0;

  170.     if(count <= o_left){
  171.       copy_to_user(buff,t_node->buff + t_node->r_off_set,count);
  172.       t_node->r_off_set += count;
  173.       return count;
  174.     }else{
  175.       copy_to_user(buff ,t_node->buff + t_node->r_off_set,o_left);
  176.       t_node->r_off_set += o_left;
  177.       return o_left;
  178.     }
  179.   
  180.   }
  181.   

  182. }
  183. int read_proc(struct file *filp,char *buf,size_t count,loff_t *offp)
  184. {
  185.   printk("read\n");
  186.   int real_count;
  187.   real_count = read_to_write(jerry,buf,count);
  188.   return real_count;
  189. }

  190. int write_proc(struct file *filp,const char *buf,size_t count,loff_t *offp)
  191. {
  192.         printk("write\n");
  193.         write_end(buf,count,jerry);           
  194.         return count;
  195. }

  196. struct file_operations proc_fops = {
  197.         read: read_proc,
  198.         write: write_proc
  199. };


  200. void create_new_proc_entry()
  201. {
  202.         proc_create("hello",0,NULL,&proc_fops);
  203. }
  204. int proc_init (void) {
  205.         
  206.         jerry = gen_cir(4);
  207.         create_new_proc_entry();
  208.         return 0;
  209. }

  210. void proc_cleanup(void) {
  211.         remove_proc_entry("hello",NULL);
  212.         clean_list_node(jerry);
  213. }

  214. MODULE_LICENSE("GPL");
  215. module_init(proc_init);
  216. module_exit(proc_cleanup);
复制代码

作者: nuclearxin    时间: 2017-03-31 14:15
我申请了4个page大小的空间作为 buff。你自己随意分配吧。

也是新手。。学习玩了
作者: superwujc    时间: 2017-03-31 15:15
回复 20# nuclearxin

geiliable

多谢大神啊,先跑一跑

作者: nswcfd    时间: 2017-04-06 17:25
这个帖子说明了在使用proc接口之前需要先了解cat和echo(shell-builtin)的io特性。
strace是个好工具。
作者: nuclearxin    时间: 2017-04-07 11:20
应该是了解  
  1. ssize_t (*read) (struct file *file, char __user *buf, size_t count, loff_t *offset);
  2. ssize_t (*write) (struct file *file, const char __user *buf, size_t count, loff_t *offset);
复制代码

的效果吧。
明显楼主不明白这个机制。

read 控制你给别人的输出 。 主动。
write 处理别人给你的输入。 被动。



作者: superwujc    时间: 2017-06-09 11:36
回复 19# nuclearxin

前段比较忙,最近业余时间恶补了一把数据结构和算法,请教大神:
好像不用链表list_head啊,直接用自己实现或内核现成的kfifo就可以吧
内核源码中的samples/kfifo/bytestream-example.c和samples/kfifo/record-example.c,我先跑一跑看看效果。。。

作者: sditmaner    时间: 2017-06-10 11:30
楼主威武,强烈支持……

作者: superwujc    时间: 2017-06-30 15:40
回复 1# superwujc

原来是个傻问题,echo和cat是的上层是通过stdio实现的,行缓冲,遇到换行符会执行read(2)/write(2)系统调用
直接执行读写系统调用则会一次性写入,包括字符序列中包含1个以上换行符的情况





欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2