免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 604 | 回复: 6

[文本处理] 如何从两种格式的数据取所需的部分? [复制链接]

论坛徽章:
17
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0015-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:38
发表于 2019-07-23 12:10 |显示全部楼层
大家好!
我有一个问题向大家请教。
有以下两种格式的数据。
格式1:
  -- Startup time: 2019-07-23T10:06:26.817+08:00[Asia/Shanghai]
  -- Current time: 2019-07-23T11:04:19.428+08:00[Asia/Shanghai]
  -- Up time:      0d 00:57:52.611

格式2:
  -- Startup time: Sun Jun 09 06:27:49 CST 2019
  -- Current time: Tue Jul 23 11:04:30 CST 2019
  -- Up time:      44d 04:36:40.724

从格式1中,我希望取出"2019-07-23T10:06:26.817+08:00",我用以下命令可以做到:
[root@dhp6:/tmp]# echo "  -- Startup time: 2019-07-23T10:06:26.817+08:00[Asia/Shanghai]"|grep -oPm1 '(?<=Startup time: ).*(?=\[)'
2019-07-23T10:06:26.817+08:00
[root@dhp6:/tmp]#

从格式2中,我希望取出"Sun Jun 09 06:27:49 CST 2019",我用以下命令可以做到:
[root@dhp6:/tmp]# echo "  -- Startup time: Sun Jun 09 06:27:49 CST 2019"|grep -oPm1 '(?<=Startup time: ).*'
Sun Jun 09 06:27:49 CST 2019
[root@dhp6:/tmp]#

我想请问一下,能不能用一条统一的命令,可以从两种不同格式的数据中取到上述内容呢?
谢谢。

论坛徽章:
5
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:40
发表于 2019-07-23 13:59 |显示全部楼层
两种情况,可以考虑加个分枝
  1. grep -Po '(?<=Startup time: ).+?((?=\[)|$)' file.txt
复制代码

论坛徽章:
17
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0015-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:38
发表于 2019-07-23 14:04 |显示全部楼层
非常感谢您的帮助!学习了!

论坛徽章:
0
发表于 2019-07-30 14:24 |显示全部楼层
grep -oP 'Startup time: \K[^[]*' file

论坛徽章:
17
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0015-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:38
发表于 2019-08-06 13:27 |显示全部楼层
回复 4# legs

您好,非常感谢您的指点。请问这个\K是什么意思啊?

论坛徽章:
0
发表于 2019-08-13 11:04 |显示全部楼层
回复 5# bikkuri

Keep the stuff left of the \K, don't include it in $&

论坛徽章:
0
发表于 2019-08-13 11:04 |显示全部楼层
回复 5# bikkuri

Keep the stuff left of the \K, don't include it in $&
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2019中国系统架构师大会

【数字转型 架构演进】SACC2019中国系统架构师大会,7折限时优惠重磅来袭!
2019年10月31日~11月2日第11届中国系统架构师大会(SACC2019)将在北京隆重召开。四大主线并行的演讲模式,1个主会场、20个技术专场、超千人参与的会议规模,100+来自互联网、金融、制造业、电商等领域的嘉宾阵容,将为广大参会者提供一场最具价值的技术交流盛会。

限时七折期:2019年8月31日前


----------------------------------------

大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP