免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2048 | 回复: 8
打印 上一主题 下一主题

[文本处理] 如何grep整条数据 [复制链接]

论坛徽章:
1
15-16赛季CBA联赛之佛山
日期:2016-04-26 13:26:26
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-04-26 10:37 |只看该作者 |倒序浏览
有个十六进制的文本:
5b5a 00dd 1234
dfdw 0033 002d
dfd0 aa33 0342
990a 5b5a 90ad
3322 9999 9ad2
.................990a

5b5a*990a是一条条完整的数据,我怎样把包含关键字dfd0 aa33的那一条记录截取出来,另外990a是一条记录的结束标志,但并不是换行标志,也就是说这一条记录不是按照常规的按行截取的。

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
2 [报告]
发表于 2016-04-26 10:41 |只看该作者
按照你的意思,可以把990a当作换行符?

论坛徽章:
29
程序设计版块每日发帖之星
日期:2016-02-29 06:20:0015-16赛季CBA联赛之天津
日期:2016-08-10 10:33:1115-16赛季CBA联赛之深圳
日期:2016-08-17 15:07:2015-16赛季CBA联赛之佛山
日期:2016-11-07 11:33:5015-16赛季CBA联赛之广夏
日期:2016-11-15 09:13:31CU十四周年纪念徽章
日期:2016-11-24 14:12:25极客徽章
日期:2016-12-07 14:03:4015-16赛季CBA联赛之深圳
日期:2016-12-07 17:15:2715-16赛季CBA联赛之北京
日期:2016-12-22 09:30:0115-16赛季CBA联赛之深圳
日期:2016-12-22 10:49:2115-16赛季CBA联赛之山西
日期:2017-02-10 09:05:3215-16赛季CBA联赛之同曦
日期:2017-02-27 14:19:08
3 [报告]
发表于 2016-04-26 10:47 |只看该作者
  1. awk -vRS="990a" '/dfd0/{s=$0;gsub("\n", " ",s)}s~/dfd0 aa33/{print $0""RT;s=""}'

  2. grep 应该不是很好处理吧
复制代码

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
4 [报告]
发表于 2016-04-26 10:53 |只看该作者
  1. paste -s f|grep -Po '5b5a.*?dfd0\s+aa33.*?990a'
复制代码

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
5 [报告]
发表于 2016-04-26 10:56 |只看该作者
  1. paste -s f|grep -Po '5b5a.*?dfd0\s+aa33.*?990a'|xargs -n3
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
6 [报告]
发表于 2016-04-26 10:58 |只看该作者
回复 1# t069064449

Would you provide more detail information ...
1. input data
2. procedure
3. output data


------------------------------------------------------------------

$ echo 123ab
123ab

$ echo 123ab | hexdump -x -c -C
0000000    3231    6133    0a62                                       
0000000   1   2   3   a   b  \n
00000000  31 32 33 61 62 0a                                 |123ab.|
00000006

   

论坛徽章:
1
15-16赛季CBA联赛之佛山
日期:2016-04-26 13:26:26
7 [报告]
发表于 2016-04-26 13:44 |只看该作者
十进制形式:
[HEAD0305 123456789SHFD ... 00001]
[HEAD0305 33SHFD ... asdfg00001]
[HEAD0305 222223SHFD ... asdfg00001]
文本中是十六进制保存的,DOS格式,只有换行符OA,没有回车符OD,现在我想把含123456789的记录截取出来,即我想要[HEAD0305 123456789SHFD ... 00001]

123.zip

208 Bytes, 下载次数: 23

论坛徽章:
1
15-16赛季CBA联赛之佛山
日期:2016-04-26 13:26:26
8 [报告]
发表于 2016-04-26 13:49 |只看该作者
我的grep怎么不支持-P -o回复 5# sunzhiguolu


   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
9 [报告]
发表于 2016-04-26 14:45 |只看该作者
回复 8# t069064449
grep --version
grep (GNU grep) 2.24
Copyright © 2016 Free Software Foundation, Inc.
GPLv3+ 许可证: GNU 通用公共许可证第三版或更高版本 <http://gnu.org/licenses/gpl.html>。
这是自由软件: 您可自由更改并重新分发它。
在法律所允许的范围内,不附带任何担保条款。

我的环境是 win7 + Cygwin.
   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP