免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: Windows19
打印 上一主题 下一主题

字符串排序 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2017-06-21 16:57 |只看该作者
回复 8# sunzhiguolu

这样打印的时候需要记住行数
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my %seen;
  5. open DATA, "<", shift;

  6. my $count = 0;
  7. while ( my $word = <DATA> ) {
  8.   chomp $word;
  9.   for my $char ( split("", $word) ) {
  10.       next if $char !~ /[a-zA-Z]/;
  11.       #next if $char !~ /[0-9]/;
  12.       $seen{$char}->{num}++;
  13.       push @{$seen{$char}->{word}}, $count . "^^^^^" . $word;
  14.   }
  15.   $count++;
  16. }

  17. my %print_seen;
  18. for my $char ( sort {$seen{$b}->{num} <=> $seen{$a}->{num}} keys %seen ) {
  19.     for my $word ( @{$seen{$char}->{word}}) {
  20.       next if $print_seen{$word}++;
  21.       print((split(/\^\^\^\^\^/, $word))[1] . "\n");
  22.     }
  23. }

  24. close DATA;
复制代码


论坛徽章:
0
12 [报告]
发表于 2017-06-21 16:59 |只看该作者
回复 7# Windows19

  1. next if $char !~ /[a-zA-Z]/;
复制代码

改成

  1. next if $char !~ /[a-zA-Z0-9]/;
复制代码


论坛徽章:
0
13 [报告]
发表于 2017-06-21 17:04 |只看该作者
回复 10# Windows19

文件大的话按照9楼的就可以,主要原理就是不能存数据

论坛徽章:
12
子鼠
日期:2014-10-11 16:46:482016科比退役纪念章
日期:2018-03-16 10:24:0515-16赛季CBA联赛之山东
日期:2017-11-10 14:32:142016科比退役纪念章
日期:2017-09-02 15:42:4715-16赛季CBA联赛之佛山
日期:2017-08-28 17:11:5515-16赛季CBA联赛之浙江
日期:2017-08-24 16:55:1715-16赛季CBA联赛之青岛
日期:2017-08-17 19:55:2415-16赛季CBA联赛之天津
日期:2017-06-29 10:34:4315-16赛季CBA联赛之四川
日期:2017-05-16 16:38:55黑曼巴
日期:2016-07-19 15:03:112015亚冠之萨济拖拉机
日期:2015-05-22 11:38:5315-16赛季CBA联赛之北京
日期:2019-08-13 17:30:53
14 [报告]
发表于 2017-06-21 17:48 |只看该作者
本帖最后由 523066680 于 2017-06-21 18:41 编辑
  1. =info
  2.     code by 523066680
  3.     2017-06
  4. =cut

  5. #!/usr/bin/perl
  6. use strict;
  7. use IO::Handle;
  8. STDOUT->autoflush(1);

  9. our $SRC = "A.txt";
  10. our $DST = "Final.txt";
  11. our %letter;
  12. our @group = ('a'..'z', 'A'..'Z');
  13. our $wd = "./tempfolder";
  14. mkdir $wd if (not -e $wd);

  15. ANALYSE_AND_EXPORT:
  16. {
  17.     my %FH;

  18.     #提前准备多个文件句柄
  19.     grep { open $FH{$_}, ">:raw", "$wd/T${_}.txt" or die "$!" } @group;

  20.     open READ, "<:raw", $SRC or die "$!";
  21.     while ( my $line = <READ> )
  22.     {
  23.         if ($line=~/([a-zA-Z])/)
  24.         {
  25.             $letter{$1} = 0 if ( not exists $letter{$1} );
  26.             $letter{$1}++;

  27.             select $FH{$1};
  28.             print $line;
  29.         }
  30.     }

  31.     #清理所有文件句柄
  32.     grep { close $FH{$_} } @group;
  33.     close READ;

  34.     select STDOUT;
  35. }

  36. COLLECT_DATA:
  37. {
  38.     my $RESULT;
  39.     my $TempFH;
  40.     open $RESULT, ">:raw", $DST or die "$!";

  41.     #按出现的次数排列出优先顺序
  42.     my @rank = sort_byValue(\%letter);

  43.     for my $name ( @rank )
  44.     {
  45.         print "Reading F$name.txt ... \n";
  46.         open $TempFH, "<:raw", "$wd/T$name.txt" or die "$!";
  47.         while (my $line = <$TempFH>)
  48.         {   
  49.             print $RESULT $line;
  50.         }
  51.         close $TempFH;
  52.     }

  53.     print "Please check $DST\n";
  54. }

  55. sub sort_byValue
  56. {
  57.     my $ref = shift;
  58.     my @arr;
  59.     @arr = reverse sort map { $ref->{$_} .",". $_  } keys %$ref;

  60.     my ($char, $times);
  61.     for (@arr)
  62.     {
  63.         ($times, $char) = split(",", $_);
  64.         print "char: $char, times: $times\n";
  65.     }

  66.     return (map { /,(.)$/; $_ = $1 } @arr);
  67. }

复制代码

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
15 [报告]
发表于 2017-06-21 17:54 |只看该作者
本帖最后由 Windows19 于 2017-06-21 18:01 编辑

回复 14# 523066680


执行脚本后返回
line 1: $'=info\r': command not found
line 2: code: command not found
line 3: $'2017-06\r': command not found
line 5: $'\r': command not found
line 6: use: command not found
line 7: use: command not found
line 7: $'\r': command not found
line 8: syntax error near unexpected token `('
line 8: `STDOUT->autoflush(1);



请问使用方法

论坛徽章:
12
子鼠
日期:2014-10-11 16:46:482016科比退役纪念章
日期:2018-03-16 10:24:0515-16赛季CBA联赛之山东
日期:2017-11-10 14:32:142016科比退役纪念章
日期:2017-09-02 15:42:4715-16赛季CBA联赛之佛山
日期:2017-08-28 17:11:5515-16赛季CBA联赛之浙江
日期:2017-08-24 16:55:1715-16赛季CBA联赛之青岛
日期:2017-08-17 19:55:2415-16赛季CBA联赛之天津
日期:2017-06-29 10:34:4315-16赛季CBA联赛之四川
日期:2017-05-16 16:38:55黑曼巴
日期:2016-07-19 15:03:112015亚冠之萨济拖拉机
日期:2015-05-22 11:38:5315-16赛季CBA联赛之北京
日期:2019-08-13 17:30:53
16 [报告]
发表于 2017-06-21 18:01 |只看该作者
本帖最后由 523066680 于 2017-06-21 18:33 编辑

回复 15# Windows19

更新了,在开头 $SRC 和 $DST 设置读入的文件名和生成的文件名。

这个问题你需要在开头加上
#!/usr/bin/perl

18:32
呼,忘了检验结果,已更改错误的地方。

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
17 [报告]
发表于 2017-06-21 18:24 |只看该作者
别忘了 打赏!!!

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
18 [报告]
发表于 2017-06-21 18:36 |只看该作者
回复 17# sunzhiguolu

Can solve the problem
No problem

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
19 [报告]
发表于 2017-06-21 18:41 |只看该作者
本帖最后由 sunzhiguolu 于 2017-06-21 18:45 编辑

回复 16# 523066680
大神的功力果然是非同凡响,我是小白。
有几个问题向大神请教,还请帮忙指点,谢谢。
  1. use IO::Handle;
复制代码
代码中没见到用到该模块中的方法呀。

  1. STDOUT->autoflush(1);
复制代码
这个函数是个啥意思。

  1. ANALYSE_AND_EXPORT:
  2. {
  3.     ...
  4. }
复制代码
这是什么结构,代码从何处开始执行? 看的有点晕菜了。。。


论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
20 [报告]
发表于 2017-06-21 18:44 |只看该作者
回复 18# Windows19
打赏啊 quanpai523066680。

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP