免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1853 | 回复: 5
打印 上一主题 下一主题

[网络子系统] 如何证明硬件中断过多导致MAC接收FIFO溢出? [复制链接]

论坛徽章:
2
程序设计版块每日发帖之星
日期:2016-08-09 06:20:00每日论坛发贴之星
日期:2016-08-09 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-10-29 15:23 |只看该作者 |倒序浏览
目前遇到的问题描述如下:
设备(arm平台单核)接收网络数据流时有丢包现象,经过排查,发现丢包数量和MAC RX FIFO溢出计数是一致的。通过/proc/interrupts查看其它硬件中断远远高于eth中断计数。
所以目前只能从代码理论上怀疑外部硬件中断过多或者处理时间过长对MAC软中断接收造成影响,导致RX FIFO溢出。

请问,如何trace到代码层面,证明我的猜想?请各位有经验的大神指教下,谢谢。

论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-08-17 06:20:00程序设计版块每日发帖之星
日期:2016-07-16 06:20:00程序设计版块每日发帖之星
日期:2016-07-18 06:20:00每日论坛发贴之星
日期:2016-07-18 06:20:00黑曼巴
日期:2016-12-26 16:00:3215-16赛季CBA联赛之江苏
日期:2017-06-26 11:05:5615-16赛季CBA联赛之上海
日期:2017-07-21 18:12:5015-16赛季CBA联赛之青岛
日期:2017-09-04 17:32:0515-16赛季CBA联赛之吉林
日期:2018-03-26 10:02:16程序设计版块每日发帖之星
日期:2016-07-15 06:20:0015-16赛季CBA联赛之江苏
日期:2016-07-07 18:37:512015亚冠之萨济拖拉机
日期:2015-08-17 12:21:08
2 [报告]
发表于 2016-10-31 10:12 |只看该作者
eth的中断少跟开启NAPI有关系吧?

可以检查一下在包处理路径上是否关闭interrupt的时间过长?

论坛徽章:
9
程序设计版块每日发帖之星
日期:2016-02-13 06:20:00数据库技术版块每日发帖之星
日期:2016-06-15 06:20:00数据库技术版块每日发帖之星
日期:2016-06-16 06:20:00数据库技术版块每日发帖之星
日期:2016-06-18 06:20:00程序设计版块每日发帖之星
日期:2016-06-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-09 06:20:00IT运维版块每日发帖之星
日期:2016-07-15 06:20:00IT运维版块每日发帖之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-08-18 06:20:00
3 [报告]
发表于 2016-11-01 14:07 |只看该作者
你 CPU占用很高么,按理讲只要CPU能力足够,CPU就不应该溢出丢包

不知道你说的FIFO溢出是指 MAC到CPU DMA ring buffer溢出 还是说phy到mac通道溢出?

论坛徽章:
2
程序设计版块每日发帖之星
日期:2016-08-09 06:20:00每日论坛发贴之星
日期:2016-08-09 06:20:00
4 [报告]
发表于 2016-11-06 11:54 |只看该作者
回复 3# mordorwww

CPU不高,但是中断非常多,而且中断上半部的时间也可能比较长。


可能造成MAC RX FIFO溢出(MAC到CPU DMA ring buffer)溢出。


因为从内核驱动层代码角度看,中断过多或者上半部处理时间太长,将影响网络接收软中断的接收,而软中断的任务就是从MAC DMA中去取数据包往上送。


所以,怎么加打印或者出一个分析报告,证明软中断的接收收到了中断的影响?

论坛徽章:
2
程序设计版块每日发帖之星
日期:2016-08-09 06:20:00每日论坛发贴之星
日期:2016-08-09 06:20:00
5 [报告]
发表于 2016-11-06 11:54 |只看该作者
回复 3# mordorwww

CPU不高,但是中断非常多,而且中断上半部的时间也可能比较长。


可能造成MAC RX FIFO溢出(MAC到CPU DMA ring buffer)溢出。


因为从内核驱动层代码角度看,中断过多或者上半部处理时间太长,将影响网络接收软中断的接收,而软中断的任务就是从MAC DMA中去取数据包往上送。


所以,怎么加打印或者出一个分析报告,证明软中断的接收收到了中断的影响?

论坛徽章:
9
程序设计版块每日发帖之星
日期:2016-02-13 06:20:00数据库技术版块每日发帖之星
日期:2016-06-15 06:20:00数据库技术版块每日发帖之星
日期:2016-06-16 06:20:00数据库技术版块每日发帖之星
日期:2016-06-18 06:20:00程序设计版块每日发帖之星
日期:2016-06-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-09 06:20:00IT运维版块每日发帖之星
日期:2016-07-15 06:20:00IT运维版块每日发帖之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-08-18 06:20:00
6 [报告]
发表于 2016-11-07 09:00 |只看该作者
本帖最后由 mordorwww 于 2016-11-07 09:12 编辑

你这网卡是万兆还是100GE的么?CPU连收个包都收不来啊?驱动是你们自己写的还是原厂写的?
网络流量大不大?如果是原厂驱动我觉得就找原厂了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP