免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5968 | 回复: 6

[文本处理] 取字段之间 [复制链接]

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
发表于 2022-01-19 20:33 |显示全部楼层
本帖最后由 unix520 于 2023-08-29 13:06 编辑



从最后一个字段取字段之间

企业 a
企业 a
**
已执行






论坛徽章:
1
19周年集字徽章-年
日期:2020-10-29 09:39:21
发表于 2022-01-20 08:07 |显示全部楼层
[ 本帖最后由 legs 于 2022-01-20 08:12 编辑 ]\n\n这次就一个单独的文件啦?

可以试试grep:
[code]grep -Poz '\N+((?!企业)[\s\S])+?已执行\n' A.txt[/code]

也可以试试Perl:

perl -0nE'say$&while/\N+((?!企业)[\s\S])+?已执行\n/g' A.txt

论坛徽章:
1
19周年集字徽章-年
日期:2020-10-29 09:39:21
发表于 2022-01-20 08:09 |显示全部楼层
这论坛的代码玩不转,老是把代码认成论坛的代码:

perl -0nE'say$&while/\N+((?!企业)[\s\S])+?已执行\n/g' A.txt

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
发表于 2022-01-20 09:16 |显示全部楼层
本帖最后由 unix520 于 2022-01-20 13:33 编辑

回复 2# legs

grep -Poz '\N+((?!企业)[\s\S])+?已执行\n' A.txt
请问如果要从第一个企业字段开始截取呢


论坛徽章:
1
19周年集字徽章-年
日期:2020-10-29 09:39:21
发表于 2022-01-20 10:16 |显示全部楼层
回复 4# unix520

  1. grep -Poz '\N+企业[\s\S]+?已执行\n' A.txt
复制代码

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
发表于 2022-01-20 10:38 |显示全部楼层
本帖最后由 unix520 于 2022-01-20 10:57 编辑

回复 5# legs

谢谢

论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-10-11 06:20:0015-16赛季CBA联赛之山东
日期:2016-05-28 18:18:5615-16赛季CBA联赛之新疆
日期:2017-04-12 22:55:4715-16赛季CBA联赛之青岛
日期:2017-06-26 18:30:0315-16赛季CBA联赛之四川
日期:2017-09-04 12:27:0315-16赛季CBA联赛之福建
日期:2018-02-09 14:28:3315-16赛季CBA联赛之同曦
日期:2018-04-17 12:43:3415-16赛季CBA联赛之浙江
日期:2018-07-14 13:27:4015-16赛季CBA联赛之吉林
日期:2018-09-13 15:48:2915-16赛季CBA联赛之新疆
日期:2016-05-07 05:05:3215-16赛季CBA联赛之八一
日期:2016-03-14 12:32:06程序设计版块每日发帖之星
日期:2015-12-12 06:20:00
发表于 2022-01-25 13:18 |显示全部楼层
  1. awk '/企业/,/已执行/' file
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP