免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2999 | 回复: 7
打印 上一主题 下一主题

[文本处理] grep 匹配 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2018-05-25 21:56 |只看该作者 |倒序浏览
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
6
程序设计版块每日发帖之星
日期:2016-05-11 06:20:00操作系统版块每日发帖之星
日期:2016-05-12 06:20:00每日论坛发贴之星
日期:2016-05-12 06:20:00操作系统版块每日发帖之星
日期:2016-05-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-31 06:20:00每日论坛发贴之星
日期:2016-05-31 06:20:00
2 [报告]
发表于 2018-05-26 07:46 |只看该作者
本帖最后由 1cpuer 于 2018-05-26 08:02 编辑
  1. # [ /home/soio/1bs/awks ] {2018-05-26 08:02:12}
  2. : 1527292932:0;➜  grep -o -E "[a-z]+_[0-9]+_[a-z 0-9]+\b" 1.dd
  3. chiyu_3636_s241n2434
  4. test_3630_s11245
  5. test_113610_t246
  6. chiyu_3636_s241n2434
  7. test_3630_s11245
  8. test_113610_t246

复制代码

回复 1# ma3501406

grep -o "\w\+_\w\+_\w\+" 1.dd
chiyu_3636_s241n2434
test_3630_s11245
test_113610_t246

论坛徽章:
0
3 [报告]
发表于 2018-05-28 16:45 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
4 [报告]
发表于 2018-05-28 18:02 |只看该作者
ma3501406 发表于 2018-05-28 16:45
回复 2# 1cpuer
要显示成如下
chiyu_3636_s241n2434

屁股后面接个管道 然后 xargs

论坛徽章:
6
程序设计版块每日发帖之星
日期:2016-05-11 06:20:00操作系统版块每日发帖之星
日期:2016-05-12 06:20:00每日论坛发贴之星
日期:2016-05-12 06:20:00操作系统版块每日发帖之星
日期:2016-05-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-31 06:20:00每日论坛发贴之星
日期:2016-05-31 06:20:00
5 [报告]
发表于 2018-05-29 11:53 |只看该作者
回复 3# ma3501406

sed 's/[a-z]\+_[0-9]\+_[a-z 0-9]\+\b/|<&>|/g; s/>|.*|</  /g ;s/^.*|<//g; s/>|.*$//g' 1.dd
grep -o 指定字符串的行 -v 排除字符串的行
只包含字符串的行作用 grep 几乎无法完成 ;设置变量也难
那其他语言和命令或代码不无可行的

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
6 [报告]
发表于 2018-05-29 13:04 |只看该作者
回复 1# ma3501406


  1. awk -F"[][]" '{for(i=1;i<=NF;i++){split($i,a,",");b=a[1]?b?b" "a[2]:a[2]:b};gsub("\"","",b);print b;b=""}' file
复制代码

论坛徽章:
4
15-16赛季CBA联赛之青岛
日期:2018-07-09 14:17:2815-16赛季CBA联赛之八一
日期:2018-08-06 15:30:0515-16赛季CBA联赛之广东
日期:2018-08-09 09:11:2115-16赛季CBA联赛之佛山
日期:2019-02-14 09:26:31
7 [报告]
发表于 2018-05-29 13:57 |只看该作者
本帖最后由 christmas1102 于 2018-05-30 10:58 编辑
  1. cat FILE
  2. dest = ["127.0.0.1","chiyu_3636_s241n2434"]
  3. all = [["127.0.0.1","test_3630_s11245"],["127.0.0.1","test_113610_t246"]]
复制代码

  1. sed -r 'N;s/.+"(\w+)"\S+\n.+"(\w+)".+"(\w+)"\S+/\1 \2 \3/' FILE
复制代码
  1. grep -Po '(?<=\42\54\42)\w+(?=\42\135)' FILE|xargs
复制代码

这一看就是python的list,丢在python里都不用正则

论坛徽章:
24
申猴
日期:2014-10-10 15:56:39射手座
日期:2014-10-10 15:57:18黑曼巴
日期:2018-05-14 11:05:122016科比退役纪念章
日期:2018-05-14 11:05:0715-16赛季CBA联赛之北控
日期:2018-05-14 11:05:0015-16赛季CBA联赛之江苏
日期:2017-02-27 18:11:0715-16赛季CBA联赛之上海
日期:2018-08-15 09:48:5415-16赛季CBA联赛之佛山
日期:2018-07-20 17:14:2315-16赛季CBA联赛之佛山
日期:2019-09-10 18:08:4615-16赛季CBA联赛之山西
日期:2020-03-26 09:40:5115-16赛季CBA联赛之佛山
日期:2020-05-08 09:03:54
8 [报告]
发表于 2018-05-29 17:37 |只看该作者
print dest[1]+'\n'+all[0][1]+' '+all[1][1]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP