免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2264 | 回复: 10

[文本处理] 精确打印20个字符串的行 [复制链接]

论坛徽章:
0
发表于 2015-12-17 23:14 |显示全部楼层
小弟想精确打印文本中只有20个字符串的行,用sed或awk或grep

1234 5678 9101 11221 ##这一行20个字符包含空格的
abcdefghijklmnopqrst   ##这一行20个字符,没有空格

12345 678910 11 22 33 44 55 77 ##这个超过20个字符

论坛徽章:
20
卯兔
日期:2015-01-26 22:05:142015亚冠之萨济拖拉机
日期:2015-09-10 15:15:282015亚冠之阿尔希拉尔
日期:2015-09-25 17:37:53程序设计版块每日发帖之星
日期:2015-10-03 06:20:00程序设计版块每日发帖之星
日期:2015-12-09 06:20:00CU十四周年纪念徽章
日期:2015-12-17 09:07:15程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:342015亚冠之广州富力
日期:2015-08-27 19:29:56每日论坛发贴之星
日期:2015-08-26 06:20:002015亚冠之阿尔希拉尔
日期:2015-05-18 17:26:27
发表于 2015-12-17 23:22 |显示全部楼层
grep -E '^.{20}$' file

论坛徽章:
6
羊年新春福章
日期:2015-03-03 17:16:28双子座
日期:2015-03-03 17:16:56巳蛇
日期:2015-03-03 17:17:2415-16赛季CBA联赛之福建
日期:2016-03-11 09:05:00黑曼巴
日期:2016-07-07 16:58:1215-16赛季CBA联赛之吉林
日期:2016-11-14 09:23:07
发表于 2015-12-18 09:34 |显示全部楼层
本帖最后由 jcdiy0601 于 2015-12-18 09:36 编辑
  1. #!/usr/bin/env python
  2. #_*_ coding:utf-8 _*_

  3. f = open('file','r')
  4. list = [x.strip() for x in f.readlines() if len(x) == 21]
  5. for i in list:
  6.         print i
  7. f.close()
复制代码

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-12-17 06:20:00
发表于 2015-12-18 09:39 |显示全部楼层
awk '{if(length($0)==20)print $0}' ufile

论坛徽章:
84
每日论坛发贴之星
日期:2015-12-29 06:20:00每日论坛发贴之星
日期:2016-01-16 06:20:00每周论坛发贴之星
日期:2016-01-17 22:22:00程序设计版块每日发帖之星
日期:2016-01-20 06:20:00每日论坛发贴之星
日期:2016-01-20 06:20:00程序设计版块每日发帖之星
日期:2016-01-21 06:20:00每日论坛发贴之星
日期:2016-01-21 06:20:00程序设计版块每日发帖之星
日期:2016-01-23 06:20:00程序设计版块每日发帖之星
日期:2016-01-31 06:20:00数据库技术版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-14 06:20:00
发表于 2015-12-18 09:54 |显示全部楼层
while read l; do [ ${#l} = 20 ] && echo $l; done <file

论坛徽章:
737
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
发表于 2015-12-18 10:15 |显示全部楼层
回复 1# byrand1984

  1. grep -x '.\{20\}' i
  2. 1234 5678 9101 11221
  3. abcdefghijklmnopqrst
复制代码

论坛徽章:
24
申猴
日期:2014-10-10 15:56:39射手座
日期:2014-10-10 15:57:18黑曼巴
日期:2018-05-14 11:05:122016科比退役纪念章
日期:2018-05-14 11:05:0715-16赛季CBA联赛之北控
日期:2018-05-14 11:05:0015-16赛季CBA联赛之江苏
日期:2017-02-27 18:11:0715-16赛季CBA联赛之上海
日期:2018-08-15 09:48:5415-16赛季CBA联赛之佛山
日期:2018-07-20 17:14:2315-16赛季CBA联赛之佛山
日期:2019-09-10 18:08:4615-16赛季CBA联赛之山西
日期:2020-03-26 09:40:5115-16赛季CBA联赛之佛山
日期:2020-05-08 09:03:54
发表于 2015-12-18 13:48 |显示全部楼层
本帖最后由 chengchow 于 2015-12-18 13:48 编辑
  1. sed -rn '/^.{20}$/p' file
  2. awk -F "" 'NF==20' file
复制代码

论坛徽章:
0
发表于 2015-12-19 20:15 |显示全部楼层
小弟谢谢楼上的各位大虾

小弟验证过都是可以的

论坛徽章:
0
发表于 2015-12-19 20:34 |显示全部楼层
回复 7# chengchow

awk  -F ""  'NF==20' file
小弟对这个命令有些费解,它为什么可以打印出20个字符串的行,特别是NF==20有点深奥
小弟知道NF是number of fields,是列的数量,$NF表示最后一列,NF表示共多少个列

小弟尝试如下的试验,该文本如果以默认的空格作为分隔符号,共有8个列
shanwei:~/awk/pipei # cat zimushuzi
abc001 abc003 hl00b2 hl00b1 i11 i115 i123L004 i123L005
yuwen001 shuxue002 yinyue003 huaxue004 wuli005 meishu006 tiyu007 gongke008

shanwei:~/awk/pipei # awk -F " " '{print NF==3}' zimushuzi  
0
0

小弟原以为,上面的命令可以打印前三列的,即如下的内容

abc001 abc003 hl00b2
yuwen001 shuxue002 yinyue003


   

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
发表于 2015-12-19 20:52 |显示全部楼层
awk 'length==20'
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP