免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4364 | 回复: 14

[ 目测题 ] 大神们, 小伙伴们 : why B.pl slow than A.pl [复制链接]

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
发表于 2014-08-09 15:34 |显示全部楼层
本帖最后由 pitonas 于 2014-08-09 12:36 编辑

A.pl:
  1. #!/usr/bin/perl
  2. my $seq = 'CATTCATTCTCTAACAGCAGTAATATTAATAATTTTCAT';
  3. $seq x= 200000;

  4. my @tr = qw[
  5.   K N K N   T T T T   R S R S   I I M I
  6.   Q H Q H   P P P P   R R R R   L L L L
  7.   E D E D   A A A A   G G G G   V V V V
  8.   _ Y _ Y   S S S S   _ C W C   L F L F
  9. ];

  10. my @I = (
  11.     [   [ 0, 1, 2, 3     ],
  12.         [ 4, 5, 6, 7     ],
  13.         [ 8, 9, 10, 11   ],
  14.         [ 12, 13, 14, 15 ]
  15.     ],
  16.     [
  17.         [ 16, 17, 18, 19 ],
  18.         [ 20, 21, 22, 23 ],
  19.         [ 24, 25, 26, 27 ],
  20.         [ 28, 29, 30, 31 ]
  21.     ],
  22.     [
  23.         [ 32, 33, 34, 35 ],
  24.         [ 36, 37, 38, 39 ],
  25.         [ 40, 41, 42, 43 ],
  26.         [ 44, 45, 46, 47 ]
  27.     ],
  28.     [
  29.         [ 48, 49, 50, 51 ],
  30.         [ 52, 53, 54, 55 ],
  31.         [ 56, 57, 58, 59 ],
  32.         [ 60, 61, 62, 63 ]
  33.     ]
  34. );

  35.    
  36. $seq =~ y/ACGT/0123/;
  37. my @dna = split //, $seq;
  38. splice @dna, @dna - @dna % 3;
  39. print @tr[ TR(@dna) ];


  40. sub TR {
  41.     map { $I[shift][shift][shift] } 0 .. $#_ / 3;
  42. }
复制代码
B.pl:
  1. #!/usr/bin/perl
  2. my $seq = 'CATTCATTCTCTAACAGCAGTAATATTAATAATTTTCAT';
  3. $seq x= 200000;

  4. my @tr = (
  5.     [ [qw/K N K N/], [qw/T T T T/], [qw/R S R S/], [qw/I I M I/] ],
  6.     [ [qw/Q H Q H/], [qw/P P P P/], [qw/R R R R/], [qw/L L L L/] ],
  7.     [ [qw/E D E D/], [qw/A A A A/], [qw/G G G G/], [qw/V V V V/] ],
  8.     [ [qw/_ Y _ Y/], [qw/S S S S/], [qw/_ C W C/], [qw/L F L F/] ],
  9. );
  10.    
  11. $seq =~ y/ACGT/0123/;
  12. my @dna = split //, $seq;
  13. splice @dna, @dna - @dna % 3;
  14. print TR(@dna);

  15. sub TR {
  16.     map { $tr[shift][shift][shift] } 0 .. $#_ / 3;
  17. }
复制代码
A.pl: 2 operations
print @tr[ TR(@dna) ];
1: TR(@dna)
2: @tr[ ... ];

B.pl: only 1 operation
print TR(@dna);
1: TR(@dna)

A.pl:: @tr , B.pl:: @I    ===>  array: 4 x 4 x 4

why ??? {:2_170:}  
B.pl slow than A.pl ?

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
发表于 2014-08-09 17:45 |显示全部楼层
回复 1# pitonas


    我猜原因是,b.pl的@tr,每调用一次,编译一次,而a.pl的@i只用了头开始的那次,你试着在b.pl中函数部分传入@tr的引用,看看速度如何

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
发表于 2014-08-09 18:58 |显示全部楼层
本帖最后由 pitonas 于 2014-08-09 12:03 编辑

IF: b.pl的@tr,每调用一次,编译一次
then: a.pl的@I,也每调用一次,编译一次


qw 这是一种语法糖 ? {:2_179:}
B2.pl 仍然比 A.pl 慢 ~ {:2_170:}

B2.pl:
  1. #!/usr/bin/perl
  2. my $seq = 'CATTCATTCTCTAACAGCAGTAATATTAATAATTTTCAT';
  3. $seq x= 200000;

  4. my @tr = (
  5.     [
  6.         [ 'K', 'N', 'K', 'N' ],
  7.         [ 'T', 'T', 'T', 'T' ],
  8.         [ 'R', 'S', 'R', 'S' ],
  9.         [ 'I', 'I', 'M', 'I' ]
  10.     ],
  11.     [
  12.         [ 'Q', 'H', 'Q', 'H' ],
  13.         [ 'P', 'P', 'P', 'P' ],
  14.         [ 'R', 'R', 'R', 'R' ],
  15.         [ 'L', 'L', 'L', 'L' ]
  16.     ],
  17.     [
  18.         [ 'E', 'D', 'E', 'D' ],
  19.         [ 'A', 'A', 'A', 'A' ],
  20.         [ 'G', 'G', 'G', 'G' ],
  21.         [ 'V', 'V', 'V', 'V' ]
  22.     ],
  23.     [
  24.         [ '_', 'Y', '_', 'Y' ],
  25.         [ 'S', 'S', 'S', 'S' ],
  26.         [ '_', 'C', 'W', 'C' ],
  27.         [ 'L', 'F', 'L', 'F' ]
  28.     ],

  29. );

  30. $seq =~ y/ACGT/0123/;
  31. my @dna = split //, $seq;
  32. splice @dna, @dna - @dna % 3;
  33. print TR(@dna);

  34. sub TR {
  35.     map { $tr[shift][shift][shift] } 0 .. $#_ / 3;
  36. }
复制代码
回复 2# yinyuemi


   

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
发表于 2014-08-10 11:22 |显示全部楼层
回复 3# pitonas


   
perldoc -f print
Because print takes a LIST, anything in the LIST is evaluated in list context, including
               any subroutines whose return lists you pass to "print".  Be
               careful not to follow the print keyword with a left parenthesis
               unless you want the corresponding right parenthesis to
               terminate the arguments to the print; put parentheses around
               all arguments (or interpose a "+", but that doesn't look as
               good).


如果把两个script里的print去掉,速度几乎相差不大,b.pl似乎更快,但是加了print之后,b.pl速度下降,原因应该是quote部分的第一句,print 需要evaluate subroutine RT返回的所有值,而 a.pl中print 后面接的是@符,所以不需要check,打印@tr的值。

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
发表于 2014-08-10 17:20 |显示全部楼层
my test: b.pl 慢 ~

a.pl
my @tmp = @tr[ TR(@dna) ];
print scalar @tmp;

b.pl
my @tmp = TR(@dna);
print scalar @tmp;


坐在巷口的那对男女, 一动也不动的呆在那里, 所以我顺便询问了.
他们说:
是 array 的关系,

A.pl: @I 数字数组
B.pl: @tr 字符串数组 ( index 操作慢了 )

所以,在这样的时候,总有一种力量它让我内牛满面
这确实是

  1. my @s = qw/ A B C D E /;
  2. my @n = 1 .. 5;

  3. # ----------------------
  4. my @n2 = (@n) x 2000000;    # fast
  5. my @s2 = (@s) x 2000000;    # slow

  6. # ----------------------
  7. my @indexn = @n2[@n2];      # fast
  8. my @indexs = @s2[@n2];      # slow

复制代码
回复 4# yinyuemi


   

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
发表于 2014-08-10 19:01 |显示全部楼层
回复 5# pitonas


   
    已经超出我的理解范围,不知哪位大神出来解释一下?

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
发表于 2014-08-10 19:17 |显示全部楼层
回复 5# pitonas


    复制一个字符串要比复制一个整数多一个malloc

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
发表于 2014-08-10 19:20 |显示全部楼层
本帖最后由 zhlong8 于 2014-08-10 19:57 编辑

5.20 后字符串有了 copy on write 差别应该就微乎其微了

测了下,5.20还是差好多

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
发表于 2014-08-10 21:42 |显示全部楼层
zhlong8 发表于 2014-08-10 19:17
回复 5# pitonas


果然是底层的原因,话说版主这个是从哪儿查的呢?

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
发表于 2014-08-11 09:02 |显示全部楼层
回复 9# yinyuemi


    现在CPAN跳到 metacpan 那篇 illguts 找不到了,你要愿意入坑的话 perl 源码里面有 sv.h, perldoc 有 http://perldoc.perl.org/index-internals.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2021中国系统架构师大会

【数字转型 架构重塑】2021年5月20日-22日第十三届中国系统架构师大会将在云端进行网络直播。

大会为期3天的议程,涉及20+专场,近120个主题,完整迁移到线上进行网络直播对会议组织来说绝非易事;但考虑到云端会议的直播形式可以实现全国各地技术爱好者的参与,也使ITPUB作为技术共享交流平台得到更好的普及,我们决定迎难而上。
http://sacc.it168.com/


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP