12 / 2 页下一页

论坛徽章:: 2

电梯直达

1楼 [收藏(0)] [报告]

发表于 2023-08-22 17:57 |只看该作者 |倒序浏览

本帖最后由 unix520 于 2023-08-23 15:59 编辑

请以文本中倒数第一个含有 " 新增" 的字符串的行, 匹配该行其中一个字符串格式 /([0-9A-Z]{1,2}:){4}[0-9A-Z]{1,2}/ , 截取文本中所有该相同名称字符串至 "结束" 之间行, "新增" 至 "结束" 可能中间会有很多行 , 或不是相邻

复制代码

awk '/([0-9A-Z]{1,2}:){4}[0-9A-Z]{1,2}/,/结束/' 1.txt 这个会全部输出

复制代码

a 新增 01:02:03:04:05:06 (
b 结束
c 新增 A1:A2:A3:A4:A5:A6 (
d 结束
e 新增 U 01:02:03:04:05:06 (
f 结束
g 新增 01:02:03:04:05:06 (
f 结束
v 01:02:03:04:05:06

复制代码

截取到所有该名称至"结束" 之间行
应该要得到
2.txt

a 新增 01:02:03:04:05:06 (
b 结束
e 新增 U 01:02:03:04:05:06 (
f 结束
g 新增 01:02:03:04:05:06 (
f 结束

复制代码

Thanks

文库|博客

legs

稍有积蓄

论坛徽章:: 1

2楼 [报告]

发表于 2023-08-23 10:06 |只看该作者

Sorry，根本看不懂需求。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

unix520

白手起家

论坛徽章:: 2

3楼 [报告]

发表于 2023-08-23 11:28 |只看该作者

本帖最后由 unix520 于 2023-08-23 12:46 编辑

回复 2# legs

如果倒数中发现第一个有 "新增" 字符串的行, 该行其中有一个字符串名称是一种格式, 但在该行位置不固定需找出所有该名称至结束之间行
匹配该格式名称

/([0-9A-Z]{1,2}:){2}[0-9A-Z]{1,2}/

复制代码

e 新增 00:01:02 (

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

legs

稍有积蓄

论坛徽章:: 1

4楼 [报告]

发表于 2023-08-23 13:38 |只看该作者

本帖最后由 legs 于 2023-08-23 13:40 编辑

unix520 发表于 2023-08-23 11:28
回复 2# legs如果倒数中发现第一个有 "新增" 字符串的行, 该行其中有一个字符串名称是一种格式, 但在该行 ...

更看不懂了，你这描述得关键信息非常含糊，都没有看明白为啥有两行被排除了。懂的人解答吧，我是真看不明白。
你这两行字，一共用逗号分成了四个半句，每一个半句都没有看懂。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

unix520

白手起家

论坛徽章:: 2

5楼 [报告]

发表于 2023-08-23 14:15 |只看该作者

本帖最后由 unix520 于 2023-08-23 14:16 编辑

回复 4# legs

v 31:00:01
倒数第一行虽然格式能匹配, 但没有" 新增"字段

c 新增 10:11:12 (
虽然有" 新增"字段, 但是要匹配字符串名称不相同

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

legs

稍有积蓄

论坛徽章:: 1

6楼 [报告]

发表于 2023-08-23 14:45 |只看该作者

unix520 发表于 2023-08-23 14:15
回复 4# legs v 31:00:01倒数第一行虽然格式能匹配, 但没有" 新增"字段c 新增 10:11:12 (虽然有" 新增"字 ...

看不懂，看不出来c,d两行跟a,b两行有什么区别，格式什么的一模一样，除了时间不一样，你要匹配精确时间，你直接写字面量就得了，干嘛要写正则？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

unix520

白手起家

论坛徽章:: 2

7楼 [报告]

发表于 2023-08-23 15:58 |只看该作者

本帖最后由 unix520 于 2023-08-23 16:04 编辑

回复 6# legs

不是时间这是ㄧ串ID格式由于太长原因我减少了几个 01:02:03:04:05:06
至于其他不用理会在顶楼已更正

至于加上a b c d 隔开, 是防止匹配了开头字段 "^新增" "^结束"

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

legs

稍有积蓄

论坛徽章:: 1

8楼 [报告]

发表于 2023-08-23 16:09 |只看该作者

本帖最后由 legs 于 2023-08-23 16:19 编辑

是不是这个意思：根据全文最后一处有“新增”和这行的时间值，根据这个时间值的内容查找文本中所有“新增“至”结尾“的段？
perl -0nE'($s)=/\X+\N*?新增\N*(\d\d:\d\d:\d\d)/;say$&while/\N*?新增\N*?$s\X*?结束\N*/g' file