免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: Tracy_Panda
打印 上一主题 下一主题

如何處理文本??? [复制链接]

论坛徽章:
1
程序设计版块每日发帖之星
日期:2016-06-29 06:20:00
11 [报告]
发表于 2016-05-26 21:45 |只看该作者
謝謝啦,頭像真是太萌了。。。。回复 8# RE_HASH


   

论坛徽章:
1
程序设计版块每日发帖之星
日期:2016-06-29 06:20:00
12 [报告]
发表于 2016-05-26 21:47 |只看该作者
大家如果有其他辦法,還請多多指教

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
13 [报告]
发表于 2016-05-27 00:41 |只看该作者
perl abc.pl file
  1. #!/usr/bin/perl
  2. use 5.022;
  3. my ( $K, @that, $i, %has, @it, $p ) = ( -1, '' );

  4. while (<>) {
  5.     my ( $k, $d, $v ) = split;
  6.     $has{$k} //= $i++;
  7.     ( $p, $K ) = ( 0, $k ) if $K != $k;
  8.     $it[ $has{$k} ][$p]    ||= $k;
  9.     $it[ $has{$k} ][ $p++ ] .= "\t$v";
  10.     push @that, $d if $d ne $that[-1];
  11. }

  12. say join "\t", @that;
  13. say for map @$_, @it;
复制代码

论坛徽章:
6
15-16赛季CBA联赛之新疆
日期:2016-03-22 22:34:5915-16赛季CBA联赛之山东
日期:2016-04-11 09:08:41程序设计版块每日发帖之星
日期:2016-06-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-19 06:20:00每日论坛发贴之星
日期:2016-07-19 06:20:0015-16赛季CBA联赛之青岛
日期:2016-07-20 22:44:17
14 [报告]
发表于 2016-05-27 01:48 |只看该作者
如果确定每组行数相同:

while (<>)
{
  $i++;
  my @F = split;
  if ($F[1] ne $O->[0]->[-1]) {  $j++; $i = 1; $O->[0]->[$j] = $F[1]; }  #Header  
  @{$O->[$i]}[0, $j] = @F[0,2];  #Key, Data Rows
}
$,="\t"; map { print @$_, "\n" } @$O;

评分

参与人数 1信誉积分 +5 收起 理由
sunzhiguolu + 5 超赞欧!!!

查看全部评分

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
15 [报告]
发表于 2016-05-27 18:44 |只看该作者
回复 6# jason680
大神, 您的代码有个地方我看不懂, 还请您指点:
while(<>){
  chomp;
  my($sKey, $sDsy, $sVal) = split;
  push(@aDsy, $sDsy) if(!$hDsy{$sDsy}++);
  push(@aKey, $sKey) if(!$hKey{$sKey}++);
  my $sCnt = ++$hCnt{$sKey}{$sDsy};
  $hVal{$sKey, $sDsy, $sCnt} = $sVal;
}

, 在这里表示啥意思啊, 以前从来没见过您这样用. 还请您指点...
   

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
16 [报告]
发表于 2016-05-28 00:21 |只看该作者
回复 15# sunzhiguolu
  1. $hVal{$sKey, $sDsy, $sCnt} = $sVal;
复制代码
eq
  1. $hVal{join $;, $sKey, $sDsy, $sCnt} = $sVal;
复制代码
kankan http://perldoc.perl.org/perlvar.html
$SUBSCRIPT_SEPARATOR

评分

参与人数 1信誉积分 +10 收起 理由
sunzhiguolu + 10 谢谢大神指点, 非常喜欢您的代码风格!

查看全部评分

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
17 [报告]
发表于 2016-05-28 00:26 |只看该作者
回复 14# RE_HASH

zhege youyisi, XX le
3Q ~     

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
18 [报告]
发表于 2016-05-28 00:34 |只看该作者
v2:
perl abc.pl file
  1. #!/usr/bin/perl
  2. use 5.010;
  3. my ( @d, @b ) = '';

  4. while (<>) {
  5.     my ( $p, $d, $q ) = split;
  6.     $b =! push @d, $d if $d ne $d[-1];
  7.     $b[ $b   ] ||= $p;
  8.     $b[ $b++ ]  .= "\t$q";
  9. }

  10. say join "\t", @d;
  11. say for @b;
复制代码

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
19 [报告]
发表于 2016-05-28 01:16 |只看该作者
回复 16# rubyish
谢谢大神指点...

   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
20 [报告]
发表于 2016-05-28 21:32 |只看该作者

  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my ($sCN, $sLast_pos, $sRN, @aData, %hPos, @aPos) = (-1, "");

  5. while (<>){
  6.     my ($sSN, $sPos, $sVal) = split;
  7.     $sVal = $sVal // '';
  8.     !$hPos{$sPos}++ ? do {$sRN = 0; push (@aPos, $sPos); $sCN++} : $sRN++;
  9.     $sLast_pos = $sPos if ($sLast_pos eq "");
  10.     $sVal = "$sSN $sVal" if ($sLast_pos eq $sPos);
  11.     $aData[$sRN][$sCN] = $sVal;
  12. }

  13. print join ("\t", "", @aPos), "\n";
  14. print "@$_\n" for @aData;
复制代码
DYS389I DYS389II        DYS390  DYS456
2698 12 27 25 15
2698 12 27 25 15
2720 12 28 24 14
2720 12   14
2736 12 29 22 15
2736 12
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP