忘记密码   免费注册 查看新帖 | 论坛精华区

ChinaUnix.net

  平台 论坛 博客 认证专区 大话IT 视频 徽章 文库 沙龙 自测 下载 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
12
最近访问板块 发新帖
楼主: lanfeng356

[文本处理] 【已解决】求一个统计行重复的AWK脚本 [复制链接]

论坛徽章:
298
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2017-03-10 20:37 |显示全部楼层
本帖最后由 sunzhiguolu 于 2017-03-10 20:42 编辑

powershell 看着的确很强大,和 C# 语言类库 类名 也非常的相似。
就是比较考验记忆力,要是 IDE 提供类似 VS 智能感知的话还好些。
有一点不是很理解,你总是说 PK 性能 这个和语言本身好像没啥大关系,倒是和编码的业务逻辑处理的关系比较紧密。(算法)

要是楼主方便的话,可以将示例数据挂到百度网盘。满足高手的效能欲。

论坛徽章:
298
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2017-03-10 21:23 |显示全部楼层
测试环境 - Windows 7
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;
  4. use utf8;
  5. use Encode qw /encode/;

  6. my (@aData , %hStat);
  7. while (<DATA>){
  8.         push (@aData, $_);
  9.         $hStat{$_}{'C'}++;
  10. }

  11. my @aMsg = ('否 是', '是 是', '是 否');
  12. foreach (@aData){
  13.         my ($pos, $no) = (0, 1);
  14.         if ($hStat{$_}{'C'} > 1){
  15.                 $pos = $hStat{$_}{'c'}++ ? -1 : 1;
  16.                 $no = $hStat{$_}{'c'};
  17.         }
  18.         print encode ('cp936', "$aMsg[$pos] $no $_");
  19. }

  20. __DATA__
  21. 000A 000861
  22. 000B 000861
  23. 100A 000118
  24. 000B 000861
  25. 000C 000861
  26. 100B 000118
  27. 100A 000118
  28. 000C 000861
  29. 100B 000118
  30. 100A 000118
复制代码


perl abc.pl
-----------------------------
否 是 1 000A 000861
是 是 1 000B 000861
是 是 1 100A 000118
是 否 2 000B 000861
是 是 1 000C 000861
是 是 1 100B 000118
是 否 2 100A 000118
是 否 2 000C 000861
是 否 2 100B 000118
是 否 3 100A 000118

论坛徽章:
2
综合交流区版块每日发帖之星
日期:2016-07-06 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:00
发表于 2017-03-11 22:54 |显示全部楼层
回复 2# haooooaaa
您需要登录后才可以回帖 登录 | 注册

本版积分规则

久等啦!10张门票开启你的DTCC2017之旅

2017中国数据库技术大会将于2017年5月11-13日如约而至,本届大会以“数据驱动•价值发现”为主题,共设定2大主场和21个技术专场,云集海内外120+位技术大牛,共同探讨Oracle、MySQL、NoSQL、云端数据库、区块链、深度学习等领域的前瞻性热点话题。
即日起,填写DTCC2017会前调查问卷,即有机会赢取价值2600元的大会门票1张!仅限10张!
----------------------------------------
活动截止时间:2017年5月5日统一公布

问卷入口>>
  

北京皓辰网域网络信息技术有限公司. 版权所有 京ICP证:060528号 北京市公安局海淀分局网监中心备案编号:1101082001
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP