免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: 18800375280
打印 上一主题 下一主题

[文本处理] grep,sed,awk,处理单个文件 [复制链接]

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
21 [报告]
发表于 2016-06-14 09:56 |只看该作者
回复 19# 时时20160307
您老客气了, 您的水平比我厉害.
我只是好奇楼主的 grep 在使用 -Pz 选项时 能够识别出 ^ 元字符在表达式上下文中的含义. 想问下 $ 元字符是否也能正确识别, 大神您那个 grep 用上面的表达式能否得出正确结果,
因为好奇 才有此一问, (如果能够得到正确结果, 请告知下 grep 的版本) 谢谢...

   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
22 [报告]
发表于 2016-06-14 09:56 |只看该作者
回复 19# 时时20160307
您老客气了, 您的水平比我厉害.
我只是好奇楼主的 grep 在使用 -Pz 选项时 能够识别出 ^ 元字符在表达式上下文中的含义. 想问下 $ 元字符是否也能正确识别, 大神您那个 grep 用上面的表达式能否得出正确结果,
因为好奇 才有此一问, (如果能够得到正确结果, 请告知下 grep 的版本) 谢谢...

   

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
23 [报告]
发表于 2016-06-14 10:23 |只看该作者
回复 17# sunzhiguolu


可以的
# grep -Poz '^#[^#]+(?=\n)' 1.txt
#789
abcd
xxoo
#fsaassfa
fsfsafsfa
NAINIAGEXIONG
fsfsfs

# grep -Poz '^#[^#]+$' 1.txt
#789
abcd
xxoo
#fsaassfa
fsfsafsfa
NAINIAGEXIONG
fsfsfs

# grep --version
grep (GNU grep) 2.20

评分

参与人数 1信誉积分 +5 收起 理由
sunzhiguolu + 5 谢谢大神指点!!!

查看全部评分

论坛徽章:
0
24 [报告]
发表于 2016-06-14 15:47 |只看该作者
  1.         while flag:
  2.             print i,
  3.             break
复制代码
这里面当flag为True时,打印以#开头的,然后就break了。
但为什么abcd这些也可以输出呢?
回复 6# mswsg


   

论坛徽章:
0
25 [报告]
发表于 2016-06-14 15:59 |只看该作者
用pdb看了下执行过程,明白了。回复 6# mswsg


   

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
26 [报告]
发表于 2016-06-14 16:11 |只看该作者
好,思路还是比较简单的回复 25# 重楼君


   

论坛徽章:
0
27 [报告]
发表于 2016-06-14 16:47 |只看该作者
发现个小问题,假如代码是这样
  1. #789
  2. abcd
  3. xxoo
  4. jjyy#
  5. ooxx
复制代码
那么jjyy#后flag变成False了,ooxx不能正常输出了。
回复 26# mswsg


   

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
28 [报告]
发表于 2016-06-15 09:10 |只看该作者
本帖最后由 mswsg 于 2016-06-15 09:13 编辑

你理解有问题,请看好楼主的要求。本来 OOXX就不输出。照你的说法,似乎事情变简单了。回复 27# 重楼君


   

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
29 [报告]
发表于 2016-06-15 09:13 |只看该作者
本帖最后由 haooooaaa 于 2016-06-15 09:15 编辑

回复 26# mswsg


    你没有编辑情况下,居然回复了自己的下一楼? 很强啊!


mswsg 发表于 2016-06-14 16:11
好,思路还是比较简单的回复 25# 重楼君


有点乱

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
30 [报告]
发表于 2016-06-15 09:18 |只看该作者
再看
本帖最后由 mswsg 于 2016-06-15 09:13 编辑


你理解有问题,请看好楼主的要求。本来 OOXX就不输出。照你的说法,似乎事情变简单了。回复 27# 重楼君
回复 29# haooooaaa


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP