免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3302 | 回复: 11
打印 上一主题 下一主题

[文本处理] sed命令_求助 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-02-04 10:31 |只看该作者 |倒序浏览
1. 直接上文件
--------------------file1--------------------
2015-02-03 21:23:07 {"appTeamName":"方正北斗B型设备","callNo":"309790","deviceType":"1",
"gpsId":"13395595019","y":31.86403,"receiveFlag":"0","speed":83.0,"x":117.29631,"id":0}

2015-02-03 21:23:17 {"gpsId":"13395595019","y":31.86373,"insertDate":"2015-02-03 21:23:17",
"insertUser":"test","speed":84.0,"updateTime":"2015-02-03 21:23:19","x":117.29751,"id":0}

.....


2. file1 文件中的每一行, 都 含有 (x,y)的值.
现在想  提取 每一行的 信息  "x":222, "y":3434
命令如下:
cat car | sed -r 's/.*("y":.*[^,],).*("x":.*[^,],).*/\1\2/'


3. 结果不对?
$ cat car | sed -r 's/.*("y":.*[^,],).*("x":.*[^,],).*/\1\2/'
"y":31.86403,"insertDate":"2015-02-03 21:23:07","insertUser":"test","onlineStatus":"1","receiveFlag":"0","speed":83.0,"updateTime":"2015-02-03 21:23:09","x":117.29631,


请 高手指教

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
2 [报告]
发表于 2015-02-04 10:46 |只看该作者
  1. sed -r 's/.*("y":[^,]*).*("x":[^,]*).*/\1\2/'
复制代码

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
3 [报告]
发表于 2015-02-04 10:46 |只看该作者
回复 1# xuzhou2015
  1. sed 's/.*\("y":[^,]*\).*\("x":[^,]*\).*/\1 \2/' file
复制代码

论坛徽章:
7
申猴
日期:2014-12-21 13:57:24巳蛇
日期:2014-12-25 22:27:08申猴
日期:2015-01-19 08:07:36辰龙
日期:2015-02-04 11:40:06处女座
日期:2015-02-04 11:40:412015年亚洲杯之卡塔尔
日期:2015-03-06 12:01:322015年亚洲杯之乌兹别克斯坦
日期:2015-03-31 13:43:57
4 [报告]
发表于 2015-02-04 11:38 |只看该作者
楼主你把电话号码暴露了

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
5 [报告]
发表于 2015-02-04 12:31 |只看该作者
本帖最后由 zsszss0000 于 2015-02-04 12:33 编辑
  1. sed  -n 's/.*\("y":[0-9]*.[0-9]*\).*\("x":[0-9]*.[0-9]*\).*/\1 \2/p' file
复制代码
TIM写的坐标匹配为
  1. \("y":[^,]*\)
复制代码
这个我不太理解,所以就把写成了
  1. \("y":[0-9]*.[0-9]*\)
复制代码

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
6 [报告]
发表于 2015-02-04 12:50 |只看该作者
本帖最后由 zsszss0000 于 2015-02-04 12:58 编辑
  1. sed 's/.*\("y":[^,]*\).*\("x":[^,]*\).*/\1 \2/' file
复制代码
我如果写为
  1. sed 's/.*\("y":.*,\).*\("x":.*,\).*/\1----\2/' file
复制代码
得不到正确的结果,得到的结果是
"y":31.86403,"receiveFlag":"0","speed":83.0, ----"x":117.29631,
是不是因为这里采用了贪心的算法,即可以匹配到x前面的逗号,
如果想匹配遇到的第一个,(也就是紧相邻的,)该怎么写?请指导我这个新手。

回复 3# ly5066113


   

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
7 [报告]
发表于 2015-02-04 13:07 |只看该作者
回复 6# zsszss0000


正则表达式是贪婪的。

sed 里如果想要匹配第一个“,” ,只能用 [^,]*, 的写法
perl 里支持非贪婪匹配,用 .*? 就可以:
  1. perl -pe 's/.*("y":.*?),.*("x":.*?),.*/$1 $2/' file
复制代码

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
8 [报告]
发表于 2015-02-04 13:18 |只看该作者
受教了
ly5066113 发表于 2015-02-04 13:07
回复 6# zsszss0000

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
9 [报告]
发表于 2015-02-04 16:51 |只看该作者
本帖最后由 jason680 于 2015-02-04 16:53 编辑

回复 1# xuzhou2015


$ sed -r 's/^.*,("y":[^,]+),.*("x":[^,]+),.*/\2, \1/' FILE
"x":117.29631, "y":31.86403
"x":117.29751, "y":31.86373

$ perl -pe 's/^.*,("y":[^,]+),.*("x":[^,]+),.*/\2, \1/' FILE
"x":117.29631, "y":31.86403
"x":117.29751, "y":31.86373

$ perl -lane '{$s="";$s=($s?"$1, $s":$1) while(m/("[xy]":[^,]+)/g);print $s}' FILE
"x":117.29631, "y":31.86403
"x":117.29751, "y":31.86373

论坛徽章:
9
射手座
日期:2014-07-29 13:05:07双子座
日期:2015-01-11 17:01:522015年亚洲杯之朝鲜
日期:2015-02-01 16:14:282015亚冠之阿尔艾因
日期:2015-06-04 17:54:40数据库技术版块每日发帖之星
日期:2015-08-02 06:20:00数据库技术版块每日发帖之星
日期:2015-10-28 06:20:00数据库技术版块每日发帖之星
日期:2015-11-26 06:20:0015-16赛季CBA联赛之天津
日期:2016-06-20 17:09:2015-16赛季CBA联赛之青岛
日期:2017-02-26 15:54:19
10 [报告]
发表于 2015-02-04 17:51 |只看该作者
回复 7# ly5066113

我也学习了


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP