免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 1539 | 回复: 13
打印 上一主题 下一主题

[文本处理] 打印 汉字 特别需求 [复制链接]

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-01-02 11:53 |只看该作者 |倒序浏览
本帖最后由 Windows19 于 2017-01-02 11:58 编辑

需要把6个汉字的行打印出来  有出现其它任何字符的行一概不要   弱弱的问下  汉字应该是设GBK编码吧
www某h某公司
www某4某某某公司.
ww某某r5[\';某*某公司/
www某某'某公司
www某-5r4645'\[;]某某某公司
www某某某;'\';[56某公司某某
www某某某rtr'\某公司某某*
www某某.'\';\][\'某\某公司某某
www某^某24'.某某公司某某
www某某@某;/][[/]][=][/;;==[].某公司某某
www某,某,某,某+*'/gf6公ytu'司某某
www某,某某;某公/'[/ytr4.>司某某
.,.\.\..fdwww某某某/.5.f某公司某某
www某某某某公[],.\4/][][\\..,\'wre司某某
www某某某某公司某某'
某某某某公司某某
某某某某公司
公司某某某某
公司某某某
公司某某
公司某
某某某公司
某某某某某公司
某某某某某某公司
某公司

应打印出结果: 出来后用空格分开的
某 某 某 某 公 司
公 司 某 某 某 某
谢谢帮忙了

最好能设打印汉字个数

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
2 [报告]
发表于 2017-01-02 12:24 |只看该作者

  1. awk '/^[^ -~]{6}$/'
复制代码

?

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
3 [报告]
发表于 2017-01-02 13:30 |只看该作者
try ...

$ file FILE
FILE: UTF-8 Unicode text

$ export n=6; perl -CSDL -lane '($s)=m/(\p{Han}+)/;if(length($s)==$ENV{n}){print join" ",split("",$s)}' FILE
某 某 某 某 公 司
公 司 某 某 某 某

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
4 [报告]
发表于 2017-01-02 13:31 |只看该作者
回复 1# Windows19

try ...

$ file FILE
FILE: UTF-8 Unicode text

$ export n=6; perl -CSDL -lane '($s)=m/(\p{Han}+)/;if(length($s)==$ENV{n}){print join" ",split("",$s)}' FILE
某 某 某 某 公 司
公 司 某 某 某 某

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
5 [报告]
发表于 2017-01-02 13:49 |只看该作者
学习了...
谢谢楼上2位老师

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
6 [报告]
发表于 2017-01-02 16:15 |只看该作者
本帖最后由 sunzhiguolu 于 2017-01-02 16:17 编辑

是论坛抽风还是我的 Firefox 抽风???
export n=6; perl -CSDL -lane '($s)=m/(\p{Han}+)/;if(length($s)==$ENV{n}){print join" ",split("",$s)}' FILE

大神, 这几个参数能否解释下。 谢谢。。。

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
7 [报告]
发表于 2017-01-02 17:53 |只看该作者
$ cat file
www某h某公司
www某4某某某公司.
ww某某r5[\';某*某公司/
www某某'某公司
www某-5r4645'\[;]某某某公司
www某某某;'\';[56某公司某某
www某某某rtr'\某公司某某*
www某某.'\';\][\'某\某公司某某
www某^某24'.某某公司某某
www某某@某;/][[/]][=][/;;==[].某公司某某
www某,某,某,某+*'/gf6公ytu'司某某
www某,某某;某公/'[/ytr4.>司某某
.,.\.\..fdwww某某某/.5.f某公司某某
www某某某某公[],.\4/][][\\..,\'wre司某某
www某某某某公司某某'
某某某某公司某某
某某某某公司
公司某某某某
公司某某某
公司某某
公司某
某某某公司
某某某某某公司
某某某某某某公司
某公司

$ export n=6; perl -CSDL -lane '($s)=m/(\p{Han}+)/;if(length($s)==$ENV{n}){print join" ",split("",$s)}' file
某 某 某 某 公 司
公 司 某 某 某 某
$

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
8 [报告]
发表于 2017-01-02 17:53 |只看该作者
可以的      

论坛徽章:
0
9 [报告]
发表于 2017-01-03 18:40 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
10 [报告]
发表于 2017-01-03 19:18 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;
  4. use utf8;
  5. use Encode qw /encode/;

  6. local $" = "\t";
  7. while (<DATA>){
  8.         s/\s+\z//;
  9.         next if (/[^\x{4E00}-\x{9FA5}]/ or length != 6);
  10.         print encode ('cp936', "@{[split]}"), "\n";
  11. }

  12. __DATA__
  13. www某h某公司
  14. www某4某某某公司.
  15. ww某某r5[\';某*某公司/
  16. www某某'某公司
  17. www某-5r4645'\[;]某某某公司
  18. www某某某;'\';[56某公司某某
  19. www某某某rtr'\某公司某某*
  20. www某某.'\';\][\'某\某公司某某
  21. www某^某24'.某某公司某某
  22. www某某@某;/][[/]][=][/;;==[].某公司某某
  23. www某,某,某,某+*'/gf6公ytu'司某某
  24. www某,某某;某公/'[/ytr4.>司某某
  25. .,.\.\..fdwww某某某/.5.f某公司某某
  26. www某某某某公[],.\4/][][\\..,\'wre司某某
  27. www某某某某公司某某'
  28. 某某某某公司某某
  29. 某某某某公司
  30. 公司某某某某
  31. 公司某某某
  32. 公司某某
  33. 公司某
  34. 某某某公司
  35. 某某某某某公司
  36. 某某某某某某公司
  37. 某公司
复制代码

perl abc.pl
----------------------
某某某某公司
公司某某某某
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP