Chinaunix

标题: 如果不采用零拷贝的话,从网卡到应用层共经历了几次拷贝? [打印本页]

作者: ruger    时间: 2007-05-16 10:22
标题: 如果不采用零拷贝的话,从网卡到应用层共经历了几次拷贝?
如果不采用零拷贝的话,从网卡到应用层共经历了几次拷贝?
作者: ruger    时间: 2007-05-16 10:24
标题: 回复 #1 ruger 的帖子
网卡DMA到内存是网卡直接完成的,就不算了,而从sock->sk_receive_queue算一次,内核协议栈中其他过程又怎么样那?
作者: bekars    时间: 2007-05-16 17:07
应该是一次
作者: AIXHP    时间: 2007-05-18 14:01
原帖由 ruger 于 2007-5-16 10:22 发表于 1楼  
如果不采用零拷贝的话,从网卡到应用层共经历了几次拷贝?

     驱动中有些情况要拷贝一次,协议处理决定包的流向等, 4层进行包的组装时可能也要一次,交还用户时要拷贝到用户BUF一次.
至少有时是2次或3次. 没有详细看linux network ------望批评指正.
作者: ruger    时间: 2007-05-19 10:50
标题: 回复 #4 AIXHP 的帖子
我看过一篇论文上写至少3次,但没有找出来,而且还有提到,耗费CPU的不但是内存拷贝还有内核锁
网卡DMA到内存算一次,用用户空间的buffer的拷贝算一次,内核协议簇的处理有一次的就三次了,但看zero-copy的情况,DMA还是要有的,而用户空间的buffer的拷贝也是有的,只有内核协议簇的处理是zero-cpoy所没有的,而内核协栈的拷贝没有确切的出现,而且好像也没有那么多的操作,仅仅就是因为内核协议栈的一些处理,导致性能下降

[ 本帖最后由 ruger 于 2007-5-19 11:40 编辑 ]
作者: watericesix    时间: 2007-06-23 21:44
用户空间到核心空间一次,形成一个sk_buff,网络协议栈中没有内存复制,直到输出以前都使用这个sk_buff。但可能使用fragment方式组织数据,如果NIC不支持Scatter/Gather方式,发送前需要增加一次复制,构造一个比较大的sk_buff。 驱动程序将sk_buff数据复制到发送缓冲区(物理地址连续,且地址已注册到NIC),这是第二次复制,网卡启动DMA,将数据由发送缓冲区复制到发送FIFO(NIC中),这是第三次复制。对于以太网,MTU比较小,通常进行三次复制,对于高性能网络,如Merynet,可能将第一、第二次复制省略,直接查页表获取数据在用户空间时的物理地址,将这些地址直接注册到NIC,直接进行DMA,只有一次数据复制。
作者: phoenixson    时间: 2007-06-24 12:25
兄弟们能不能用个图示表示一下啊,不能很好的理解啊。
作者: anne0613d    时间: 2007-06-26 12:10

作者: chishanmingshen    时间: 2013-01-14 15:48
本帖最后由 chishanmingshen 于 2013-01-14 16:53 编辑

收包流程中, dma一次拷贝, 然后skb在netif_receive_skb()之后直接送到了socket的接收队列中, 然后拷贝到进程. 明明就2次拷贝啊 , 对不?
为何大家都说有3次???

作者: chishanmingshen    时间: 2013-01-15 10:48
回复 5# ruger

你说的"内核协议簇的处理有一次", 是代码的哪里???

请高手们指点啊....


   
作者: luoyan_xy    时间: 2013-01-15 23:07
    个人偏向也是两次,非要说三次的话,难道是这样的?
    从网卡到内核,从ip层到tcp层的缓冲区,从tcp层缓冲区到用户空间
作者: chishanmingshen    时间: 2013-01-16 08:47
"从ip层到tcp层的缓冲区"<-------代码哪里?
回复 11# luoyan_xy


   
作者: mordorw    时间: 2013-01-16 09:41
本帖最后由 mordorw 于 2013-01-16 09:43 编辑

我认为:

本地收发报文的场景,        耗CPU的拷贝  只有一次,就是用户进程和内核之间的拷贝
转发的场景,                 没有  耗CPU的拷贝

还有1到2次  不耗CPU的拷贝,  就是耗总线和内存的DMA拷贝, CPU不参与,但是总线和内存参与,也会影响CPU的计算性能
作者: chishanmingshen    时间: 2013-01-16 10:52
我不关注性能,我现在是想知道流程啊, 请标明相关代码的地方...求助~~回复 13# mordorw


   
作者: mordorw    时间: 2013-01-16 12:16
本帖最后由 mordorw 于 2013-01-16 12:19 编辑

两个点:

            收发              处理                 传递
网卡<---------->系统内核(内存)<-------------->用户进程(内存)


内核在处理报文的时候一般不会对报文做拷贝操作
传递的时候由于内核内存和用户内存的隔离性,需要拷贝。如果做内存映射,那就是零拷贝
收发的拷贝由DMA完成

表述的应该很清楚了,对不对大家判断
作者: chishanmingshen    时间: 2013-01-16 12:44
我也是这么就理解的, 就2次拷贝.
可是为何大家都说是3次拷贝???
回复 15# mordorw


   
作者: mordorw    时间: 2013-01-16 13:19
要那个人给出一个解释,不然暴扁
作者: 灌水菜鸟    时间: 2013-01-16 14:13
理想情况下,不考虑分片不考虑多播的话,TPC来说:从网卡进来之后,一直都是指针操作,直到TCP层整理数据一次,然后拷贝到用户态一次。也就是两次。其他的协议UDP差不多是一样的,SCTP就不是清楚了。
作者: mordorw    时间: 2013-01-16 17:40
TCP层整理数据需要拷贝?为什么?

分片组包一般也不会拷贝,分片可能需要拷贝




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2