免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2318 | 回复: 6
打印 上一主题 下一主题

[文本处理] 如何从两种格式的数据取所需的部分? [复制链接]

论坛徽章:
18
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:3815-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0020周年集字徽章-年
日期:2023-04-23 11:17:52
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2019-07-23 12:10 |只看该作者 |倒序浏览
大家好!
我有一个问题向大家请教。
有以下两种格式的数据。
格式1:
  -- Startup time: 2019-07-23T10:06:26.817+08:00[Asia/Shanghai]
  -- Current time: 2019-07-23T11:04:19.428+08:00[Asia/Shanghai]
  -- Up time:      0d 00:57:52.611

格式2:
  -- Startup time: Sun Jun 09 06:27:49 CST 2019
  -- Current time: Tue Jul 23 11:04:30 CST 2019
  -- Up time:      44d 04:36:40.724

从格式1中,我希望取出"2019-07-23T10:06:26.817+08:00",我用以下命令可以做到:
[root@dhp6:/tmp]# echo "  -- Startup time: 2019-07-23T10:06:26.817+08:00[Asia/Shanghai]"|grep -oPm1 '(?<=Startup time: ).*(?=\[)'
2019-07-23T10:06:26.817+08:00
[root@dhp6:/tmp]#

从格式2中,我希望取出"Sun Jun 09 06:27:49 CST 2019",我用以下命令可以做到:
[root@dhp6:/tmp]# echo "  -- Startup time: Sun Jun 09 06:27:49 CST 2019"|grep -oPm1 '(?<=Startup time: ).*'
Sun Jun 09 06:27:49 CST 2019
[root@dhp6:/tmp]#

我想请问一下,能不能用一条统一的命令,可以从两种不同格式的数据中取到上述内容呢?
谢谢。

论坛徽章:
8
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:0615-16赛季CBA联赛之北控
日期:2021-03-30 15:53:34
2 [报告]
发表于 2019-07-23 13:59 |只看该作者
两种情况,可以考虑加个分枝
  1. grep -Po '(?<=Startup time: ).+?((?=\[)|$)' file.txt
复制代码

论坛徽章:
18
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:3815-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0020周年集字徽章-年
日期:2023-04-23 11:17:52
3 [报告]
发表于 2019-07-23 14:04 |只看该作者
非常感谢您的帮助!学习了!

论坛徽章:
1
19周年集字徽章-年
日期:2020-10-29 09:39:21
4 [报告]
发表于 2019-07-30 14:24 |只看该作者
grep -oP 'Startup time: \K[^[]*' file

论坛徽章:
18
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:3815-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0020周年集字徽章-年
日期:2023-04-23 11:17:52
5 [报告]
发表于 2019-08-06 13:27 |只看该作者
回复 4# legs

您好,非常感谢您的指点。请问这个\K是什么意思啊?

论坛徽章:
1
19周年集字徽章-年
日期:2020-10-29 09:39:21
6 [报告]
发表于 2019-08-13 11:04 |只看该作者
回复 5# bikkuri

Keep the stuff left of the \K, don't include it in $&

论坛徽章:
1
19周年集字徽章-年
日期:2020-10-29 09:39:21
7 [报告]
发表于 2019-08-13 11:04 |只看该作者
回复 5# bikkuri

Keep the stuff left of the \K, don't include it in $&
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP