免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3648 | 回复: 16
打印 上一主题 下一主题

请c++ 高手调优 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-07-26 23:23 |只看该作者 |倒序浏览
本帖最后由 llslls_007 于 2010-08-06 20:23 编辑

以下3个函数分别用c 数组 ,c++ list  和 c++ vector 分别实现 0-9 10个数的全排列
输出 ,编译器为CC,工作中尝试过c++改写c程序,发现速度也有慢些,用c++一直担心
速度问题。
c 用时间 10秒钟
c++ vector 完全是模仿c写的 却要 30多秒钟(不知道为何)
c++ list    则是要5分钟 (不能忍受)

请大侠帮忙指出慢在哪?
  1. void permutation(int *array,int N,int * array_bak,int num){  
  2.           // array 为要进行排列的数组 ,N array 中元素个数,初值为10,array_bak是排列的数组
  3.            //num为排列中数字个数,初值为0

  4.                  int array_temp[10];   
  5.           if(num==10){
  6.           for(int i=0;i<10;i++)
  7.              {
  8.                  printf("%d",*(array_bak+i));
  9.                  printf("\n");
  10.               }
  11.             return;
  12.           }
  13.           for(int i=0;i<N;i++){
  14.            //从array中 选择一个数放入排列array_bak中, array中其余的元素拷贝到临时数组array_temp中,
  15.             //array_temp就是下个递归调用需要排列的数组
  16.             //,直到num==10 表示排列中已有10个数字
  17.           
  18.              array_bak[num]=array[i];
  19.             temp_bak=array[i];
  20.             if(i==0)         
  21.                     memcpy(array_temp,array+1,sizeof(int)*(N-1));
  22.             else if(i==N-1)
  23.                     memcpy(array_temp,array,sizeof(int)*(N-1));
  24.             else
  25.                     {
  26.                          memcpy(array_temp,array,sizeof(int)*(i));
  27.                       memcpy(array_temp+i,array+i+1,sizeof(int)*(N-i-1));
  28.                      }
  29.             permutation(array_temp,N-1,array_bak,num+1);
  30.             
  31.            }
  32.           }

  33. template<typename T>
  34. void  tem_permutation(list<typename T> &lis ,list<typename T> &lis_bak,int & NUM){
  35.   //lis要排列的数组,lis_bak存储排列,NUM标记排列中数字个数  
  36. if(10==NUM)
  37.           {
  38.       for_each(lis_bak.begin(),lis_bak.end(),display);
  39.       cout<<endl;
  40.       return;
  41.     }
  42.   for(list<T>::iterator it=lis.begin();it!=lis.end();it++)
  43.      {
  44.        //把已排列的元素标记为-1,找到不为-1的元素,加入到排lis_bak中,
  45.     //递归直到NUM 为10 表示lis_bak中已有10个数字
  46.      
  47.      T temp;
  48.        if(*it==-1)
  49.                 continue;
  50.        lis_bak.push_back(*it);      
  51.        temp=*it;
  52.        *it=-1;
  53.        NUM++;
  54.        tem_permutation(lis,lis_bak,NUM);
  55.        *it=temp;         
  56.        lis_bak.pop_back();
  57.        --NUM;
  58.      }  
  59. }



  60. template<typename T>         
  61. void vec_permutation(vector<typename T> &vec,int N,vector<typename T> &vec_bak,int NUM){
  62.         //完全按c的思路写的,却比c慢很多
  63.          
  64.           vector<T> vec_temp(10,-1);
  65.         T temp;
  66.         if(NUM==10)
  67.                 {
  68.                  for(int i=0;i<10;i++)
  69.                   printf("%d",vec_bak[i]);
  70.                   printf("\n");
  71.                   return;
  72.                  }
  73.          for(int i=0;i<N;i++){
  74.             vec_bak[NUM]=vec[i];
  75.           
  76.           if(i==0)
  77.              memcpy(&vec_temp[0],&vec[0]+1,sizeof(int)*(N-1));
  78.           else if(i==N-1)
  79.             memcpy(&vec_temp[0],&vec[0],sizeof(int)*(N-1));
  80.           else
  81.             {
  82.                memcpy(&vec_temp[0],&vec[0],sizeof(int)*(i));
  83.                memcpy(&vec_temp[0]+i,&vec[0]+i+1,sizeof(int)*(N-i-1));
  84.             }
  85.            vec_permutation(vec_temp,N-1,vec_bak,NUM+1);
  86.            }
  87.         }

复制代码
*********************************************************************
再添加一种:采用c++ 标准库算法 next_permutation 时间为27秒 ,如果把display 函数中的
           printf 函数改为 cout 则需要5分钟 ,难道printf 和cout 的io 效率 相差这么大?
           是缓冲区设置的问题吗?
void nt_permutation(vector<int> & vec){
        sort(vec.begin(),vec.end());
        while(next_permutation(vec.begin(),vec.end() ) ){
                for_each(vec.begin(),vec.end(),display );
                cout<<endl;
        }

论坛徽章:
0
2 [报告]
发表于 2010-07-27 19:22 |只看该作者
回复 1# llslls_007


    哎,我自己顶个先!!!

  在 c++ vector 实现中 ,把69行
69.  vector<T> vec_temp(10,-1);
       改为:
   
     vector<T> vec_temp;
        vec_temp.reserve(10);

   效率更高高,避免每次递归调用中临时变量 vec_temp 都要初始化
  10个int 为-1,节省了300多万次初始化, 速度提升到21秒左右
  但和c 数组的实现还有 10s的差距

  继续等待高人!!!

论坛徽章:
9
摩羯座
日期:2013-08-15 15:18:48狮子座
日期:2013-09-12 18:07:47金牛座
日期:2013-09-16 13:23:09辰龙
日期:2013-10-09 09:03:27白羊座
日期:2013-10-17 13:32:44子鼠
日期:2014-04-23 15:09:38戌狗
日期:2014-09-17 11:37:542015年亚洲杯之韩国
日期:2015-03-26 10:16:442015亚冠之武里南联
日期:2015-08-18 14:55:52
3 [报告]
发表于 2010-07-27 23:14 |只看该作者
LZ这个不是C与C++的速度差异,而是栈上分配变量与堆上分配变量的速度差异。
你这段C代码都是栈上面定义的,而C++的vector却是堆上new出来,你说该怎么比较?
或许可以把C这段也改成malloc比较下速度试试。

论坛徽章:
0
4 [报告]
发表于 2010-07-27 23:32 |只看该作者
回复 3# w_anthony


    恩,明天按照你的思路,把临时变量都改成全局变量

免得分配了,速度应该就差不多了吧

论坛徽章:
9
摩羯座
日期:2013-08-15 15:18:48狮子座
日期:2013-09-12 18:07:47金牛座
日期:2013-09-16 13:23:09辰龙
日期:2013-10-09 09:03:27白羊座
日期:2013-10-17 13:32:44子鼠
日期:2014-04-23 15:09:38戌狗
日期:2014-09-17 11:37:542015年亚洲杯之韩国
日期:2015-03-26 10:16:442015亚冠之武里南联
日期:2015-08-18 14:55:52
5 [报告]
发表于 2010-07-27 23:50 |只看该作者
本帖最后由 w_anthony 于 2010-07-28 00:04 编辑

回复 4# llslls_007


    我测试了一下,不计算printf输出时间,C那段耗时0.4秒多,C++的vector那段耗时23秒多,C那段改成malloc+free耗时9秒多,C++那段vector的vec_temp改成static类型变量耗时也是0.4秒左右。
可以看出绝大多数时间还是消耗在内存分配和构造函数执行上面。

/*************************************************************/

想错了,vec_temp不能是static变量,否则递归下去会把数据搞乱。

论坛徽章:
324
射手座
日期:2013-08-23 12:04:38射手座
日期:2013-08-23 16:18:12未羊
日期:2013-08-30 14:33:15水瓶座
日期:2013-09-02 16:44:31摩羯座
日期:2013-09-25 09:33:52双子座
日期:2013-09-26 12:21:10金牛座
日期:2013-10-14 09:08:49申猴
日期:2013-10-16 13:09:43子鼠
日期:2013-10-17 23:23:19射手座
日期:2013-10-18 13:00:27金牛座
日期:2013-10-18 15:47:57午马
日期:2013-10-18 21:43:38
6 [报告]
发表于 2010-07-28 08:39 |只看该作者
搞不懂LZ想要怎么样的一个结果

论坛徽章:
0
7 [报告]
发表于 2010-07-28 10:11 |只看该作者
回复 6# hellioncu


     同样的思路,想把c++ 做得和 c 一样快

论坛徽章:
324
射手座
日期:2013-08-23 12:04:38射手座
日期:2013-08-23 16:18:12未羊
日期:2013-08-30 14:33:15水瓶座
日期:2013-09-02 16:44:31摩羯座
日期:2013-09-25 09:33:52双子座
日期:2013-09-26 12:21:10金牛座
日期:2013-10-14 09:08:49申猴
日期:2013-10-16 13:09:43子鼠
日期:2013-10-17 23:23:19射手座
日期:2013-10-18 13:00:27金牛座
日期:2013-10-18 15:47:57午马
日期:2013-10-18 21:43:38
8 [报告]
发表于 2010-07-28 10:16 |只看该作者
回复  hellioncu


     同样的思路,想把c++ 做得和 c 一样快
llslls_007 发表于 2010-07-28 10:11



    那不可能的,访问vector、list跟数组自然开销要大。
c++又不是不能用数组,何必一定要vector、list呢

论坛徽章:
0
9 [报告]
发表于 2010-07-28 12:57 |只看该作者
注意你的流和内存分配。

自己测试malloc和new得速度。另外当然还有delete和free

注意printf比stream快的多。

论坛徽章:
0
10 [报告]
发表于 2010-08-06 20:22 |只看该作者
回复 1# llslls_007


    printf   和 cout  相差这么大?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP