免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: wangshzh
打印 上一主题 下一主题

如何对memcpy()进行优化 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2008-10-23 21:27 |只看该作者
优化:比如可以转换为int等机器字类型的指针来复制可以显著提高效率

论坛徽章:
0
12 [报告]
发表于 2008-10-23 21:32 |只看该作者
从低到高拷贝,速度要快些吧,可以自己写段代码测试一下

论坛徽章:
0
13 [报告]
发表于 2008-10-23 22:04 |只看该作者
我觉得还需要提前判断是否有足够的内存空间进行分配。 如果是嵌入式系统,可以提前分配空间,再进行拷贝

论坛徽章:
0
14 [报告]
发表于 2008-10-23 22:06 |只看该作者
个人觉得还可以用sizeof(TYPE), 因为在c的动态内存分配函数调用的时候,都是鼓励用户使用这种办法

论坛徽章:
9
摩羯座
日期:2013-08-15 15:18:48狮子座
日期:2013-09-12 18:07:47金牛座
日期:2013-09-16 13:23:09辰龙
日期:2013-10-09 09:03:27白羊座
日期:2013-10-17 13:32:44子鼠
日期:2014-04-23 15:09:38戌狗
日期:2014-09-17 11:37:542015年亚洲杯之韩国
日期:2015-03-26 10:16:442015亚冠之武里南联
日期:2015-08-18 14:55:52
15 [报告]
发表于 2008-10-24 09:36 |只看该作者
使用库函数的memcpy会有优化,如果count是4的倍数,会直接使用rep movs指令做复制,即便不是4的倍数,也会先用rep movs指令复制,不足部分再用字或字节复制补齐。因为复制是4字节一个单位,所以可以效率提高很多。
而rep movs必定是从低到高的,不过memcpy对高到低还是低到高没有绝对的规定,如果是memmove,他会根据实际情况来选择是从低到高复制还是相反,因为复制源和目标可能会有重叠部分,这时候顺序就很重要了,使用memmove总是可以安全的进行复制。
VC的memcpy与memmove基本相同,有重叠部分也可以做到安全复制。

[ 本帖最后由 w_anthony 于 2008-10-24 09:38 编辑 ]

论坛徽章:
0
16 [报告]
发表于 2008-10-24 10:56 |只看该作者
对不同的cpu,应该优化的方法不一样,比如有些支持多字节传送指令的
但最起码的一点,就是要字拷贝

论坛徽章:
324
射手座
日期:2013-08-23 12:04:38射手座
日期:2013-08-23 16:18:12未羊
日期:2013-08-30 14:33:15水瓶座
日期:2013-09-02 16:44:31摩羯座
日期:2013-09-25 09:33:52双子座
日期:2013-09-26 12:21:10金牛座
日期:2013-10-14 09:08:49申猴
日期:2013-10-16 13:09:43子鼠
日期:2013-10-17 23:23:19射手座
日期:2013-10-18 13:00:27金牛座
日期:2013-10-18 15:47:57午马
日期:2013-10-18 21:43:38
17 [报告]
发表于 2008-10-24 11:01 |只看该作者
原帖由 w_anthony 于 2008-10-24 09:36 发表
使用库函数的memcpy会有优化,如果count是4的倍数,会直接使用rep movs指令做复制,即便不是4的倍数,也会先用rep movs指令复制,不足部分再用字或字节复制补齐。因为复制是4字节一个单位,所以可以效率提高很多 ...


说得挺全面的。从低往高地址,我想可能是为了提高cache命中率

论坛徽章:
0
18 [报告]
发表于 2008-10-24 13:42 |只看该作者
这题没那么简单:
1.缺少很多判断   如 assert(src != NULl);
2.认清memcpy和strcpy的区别;
3.考虑内存溢出

论坛徽章:
0
19 [报告]
发表于 2008-10-24 16:24 |只看该作者
1: 至少要做assert的检查
2: 可能与大多数的cpu采用小段方式作为存贮模式有关系。

论坛徽章:
0
20 [报告]
发表于 2008-10-24 16:34 |只看该作者
比较完整的memcpy()函数
  1. void* mymemcpy( void *dest, const void *src, size_t count )
  2. {
  3.     char* pdest = static_cast<char*>( dest );
  4.     const char* psrc = static_cast<const char*>( src );
  5.     if( pdest>psrc && pdest<psrc+cout ) //能考虑到这种情况就行了
  6.     {
  7.         for( size_t i=count-1; i!=-1; --i )
  8.                 pdest[i] = psrc[i];
  9.     }
  10.     else
  11.     {
  12.         for( size_t i=0; i<count; ++i )
  13.             pdest[i] = psrc[i];
  14.     }
  15.     return dest;
  16. }
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP