Chinaunix

标题: 如果不采用零拷贝的话，从网卡到应用层共经历了几次拷贝？ [打印本页]

作者: ruger 时间: 2007-05-16 10:22
标题: 如果不采用零拷贝的话，从网卡到应用层共经历了几次拷贝？
如果不采用零拷贝的话，从网卡到应用层共经历了几次拷贝？

作者: ruger 时间: 2007-05-16 10:24
标题: 回复 #1 ruger 的帖子
网卡DMA到内存是网卡直接完成的，就不算了，而从sock->sk_receive_queue算一次，内核协议栈中其他过程又怎么样那？

作者: bekars 时间: 2007-05-16 17:07
应该是一次

作者: AIXHP 时间: 2007-05-18 14:01

原帖由 ruger 于 2007-5-16 10:22 发表于 1楼
如果不采用零拷贝的话，从网卡到应用层共经历了几次拷贝？

驱动中有些情况要拷贝一次,协议处理决定包的流向等, 4层进行包的组装时可能也要一次,交还用户时要拷贝到用户BUF一次.
至少有时是2次或3次. 没有详细看linux network ------望批评指正.

作者: ruger 时间: 2007-05-19 10:50
标题: 回复 #4 AIXHP 的帖子
我看过一篇论文上写至少3次，但没有找出来，而且还有提到，耗费CPU的不但是内存拷贝还有内核锁
网卡DMA到内存算一次，用用户空间的buffer的拷贝算一次，内核协议簇的处理有一次的就三次了，但看zero-copy的情况，DMA还是要有的，而用户空间的buffer的拷贝也是有的，只有内核协议簇的处理是zero-cpoy所没有的，而内核协栈的拷贝没有确切的出现，而且好像也没有那么多的操作，仅仅就是因为内核协议栈的一些处理，导致性能下降

[ 本帖最后由 ruger 于 2007-5-19 11:40 编辑 ]

作者: watericesix 时间: 2007-06-23 21:44
用户空间到核心空间一次，形成一个sk_buff，网络协议栈中没有内存复制，直到输出以前都使用这个sk_buff。但可能使用fragment方式组织数据，如果NIC不支持Scatter/Gather方式，发送前需要增加一次复制，构造一个比较大的sk_buff。驱动程序将sk_buff数据复制到发送缓冲区（物理地址连续，且地址已注册到NIC），这是第二次复制，网卡启动DMA，将数据由发送缓冲区复制到发送FIFO（NIC中），这是第三次复制。对于以太网，MTU比较小，通常进行三次复制，对于高性能网络，如Merynet,可能将第一、第二次复制省略，直接查页表获取数据在用户空间时的物理地址，将这些地址直接注册到NIC，直接进行DMA，只有一次数据复制。

作者: phoenixson 时间: 2007-06-24 12:25
兄弟们能不能用个图示表示一下啊，不能很好的理解啊。

作者: anne0613d 时间: 2007-06-26 12:10

作者: chishanmingshen 时间: 2013-01-14 15:48
本帖最后由 chishanmingshen 于 2013-01-14 16:53 编辑

收包流程中, dma一次拷贝, 然后skb在netif_receive_skb()之后直接送到了socket的接收队列中, 然后拷贝到进程. 明明就2次拷贝啊 , 对不?
为何大家都说有3次???

作者: chishanmingshen 时间: 2013-01-15 10:48
回复 5# ruger

你说的"内核协议簇的处理有一次", 是代码的哪里???

请高手们指点啊....

作者: luoyan_xy 时间: 2013-01-15 23:07
个人偏向也是两次，非要说三次的话，难道是这样的？
从网卡到内核，从ip层到tcp层的缓冲区，从tcp层缓冲区到用户空间

作者: chishanmingshen 时间: 2013-01-16 08:47
"从ip层到tcp层的缓冲区"<-------代码哪里?
回复 11# luoyan_xy

作者: mordorw 时间: 2013-01-16 09:41
本帖最后由 mordorw 于 2013-01-16 09:43 编辑

我认为:

本地收发报文的场景,       耗CPU的拷贝  只有一次，就是用户进程和内核之间的拷贝
转发的场景，                没有  耗CPU的拷贝

还有1到2次  不耗CPU的拷贝，  就是耗总线和内存的DMA拷贝， CPU不参与，但是总线和内存参与，也会影响CPU的计算性能

作者: chishanmingshen 时间: 2013-01-16 10:52
我不关注性能,我现在是想知道流程啊, 请标明相关代码的地方...求助~~回复 13# mordorw

作者: mordorw 时间: 2013-01-16 12:16
本帖最后由 mordorw 于 2013-01-16 12:19 编辑

两个点:

收发处理传递
网卡<---------->系统内核(内存)<-------------->用户进程(内存)

内核在处理报文的时候一般不会对报文做拷贝操作
传递的时候由于内核内存和用户内存的隔离性，需要拷贝。如果做内存映射，那就是零拷贝
收发的拷贝由DMA完成

表述的应该很清楚了，对不对大家判断

作者: chishanmingshen 时间: 2013-01-16 12:44
我也是这么就理解的, 就2次拷贝.
可是为何大家都说是3次拷贝???
回复 15# mordorw

作者: mordorw 时间: 2013-01-16 13:19
要那个人给出一个解释，不然暴扁

作者: 灌水菜鸟 时间: 2013-01-16 14:13
理想情况下，不考虑分片不考虑多播的话，TPC来说：从网卡进来之后，一直都是指针操作，直到TCP层整理数据一次，然后拷贝到用户态一次。也就是两次。其他的协议UDP差不多是一样的，SCTP就不是清楚了。

作者: mordorw 时间: 2013-01-16 17:40
TCP层整理数据需要拷贝？为什么？

分片组包一般也不会拷贝，分片可能需要拷贝

欢迎光临 Chinaunix (http://bbs.chinaunix.net/)