免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 11642 | 回复: 13
打印 上一主题 下一主题

如何知道cpu每个时钟周期执行的指令条数? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-12-11 18:17 |只看该作者 |倒序浏览
如题,谢谢

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
2 [报告]
发表于 2007-12-11 19:21 |只看该作者

回复 #1 gridpc 的帖子

对于 issue 宽度大于 1, 且流水线很深的 CPU, 这个问题是没有多少意义的。

当然, 你可以取平均值。

论坛徽章:
0
3 [报告]
发表于 2007-12-11 19:29 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
4 [报告]
发表于 2007-12-12 09:21 |只看该作者

回复 #3 jamesr 的帖子

还要把 cache 也考虑进去。

论坛徽章:
0
5 [报告]
发表于 2007-12-12 12:31 |只看该作者
没有办法精确测试。

论坛徽章:
0
6 [报告]
发表于 2007-12-12 13:00 |只看该作者
指令的长度不一样,而且其周期也不一样。如果用最短指令的话还好。
取得pc值,定时器置一定的tick(滴答)值,计数中断后,再取得pc值。(后pc-前pc)/指令长度/tick数=result

[ 本帖最后由 sep 于 2007-12-12 13:01 编辑 ]

论坛徽章:
0
7 [报告]
发表于 2007-12-22 19:27 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
8 [报告]
发表于 2007-12-22 20:30 |只看该作者
最理想的情况下是一个周期一个指令,但是情况很多,不可能精确的!!!

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
9 [报告]
发表于 2007-12-23 15:20 |只看该作者
原帖由 jamesr 于 2007-12-22 19:27 发表

正是如此,才说尽量不要使用内存,cache miss的影响可以忽略。

指令本身总该要有地方放吧?除非你的测试程序真的很小,而且系统的负载也非常轻。。。

论坛徽章:
0
10 [报告]
发表于 2007-12-25 18:38 |只看该作者
就目前来说,4发射结构,平均IPC在2左右就很好。
对于x86,最新的Core2,理论最大发射数6~8,IPC应该能到3 ???
安腾处理器非常特别,最大发射数10以上没问题,IPC应该可以到4~6
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP