免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 5123 | 回复: 19
打印 上一主题 下一主题

[文本处理] 怎么处理一段数据中最后一个字段的数据 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-09-25 10:41 |只看该作者 |倒序浏览
内容如下
RecordId##User##User Type##Terminal##Start Time##Category##Operation##Operation Object##Result##Details##End Time##CompareTime
1111##2222##3333##4444##5555##6666##7777##8888##9999##1010##2020##3030
......   /中间还很多这种数据
1111##2222##3333##4444##5555##6666##7777##8888##9999##1010##2020##3040

要求将最后一段数据输出掉包括##
输出结果为:
RecordId##User##User Type##Terminal##Start Time##Category##Operation##Operation Object##Result##Details##End Time
1111##2222##3333##4444##5555##6666##7777##8888##9999##1010##2020
......   /中间还很多这种数据
1111##2222##3333##4444##5555##6666##7777##8888##9999##1010##2020

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
2 [报告]
发表于 2012-09-25 10:59 |只看该作者
回复 1# a774050174

try
  1.   sed 's/##[^#]*$//' urfile
复制代码

论坛徽章:
0
3 [报告]
发表于 2012-09-25 11:03 |只看该作者
回复 2# blackold
果然简单,shell不精呀,学习了。。

   

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
4 [报告]
发表于 2012-09-25 11:09 |只看该作者
回复 3# a774050174


    这种就不用学了。

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
5 [报告]
发表于 2012-09-25 11:21 |只看该作者
本帖最后由 dn833 于 2012-09-25 11:24 编辑
  1. awk 'BEGIN{FS=OFS="##"}NF-=1'
复制代码
  1. grep -Po '.*(?=##)'
复制代码

论坛徽章:
0
6 [报告]
发表于 2012-09-25 12:16 |只看该作者
  1. #!/usr/bin/env python  
  2. #-*- coding:utf-8 -*-  

  3. f = open('1.txt')

  4. for i in f:
  5.     if i.find('##') > 0:
  6.         print '##'.join(i.split('##')[:-1])
  7.     else:
  8.         print i,
  9. f.close()
复制代码

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
7 [报告]
发表于 2012-09-25 14:06 |只看该作者
  1. while read line; do echo ${line%##*}; done < infile
复制代码

论坛徽章:
0
8 [报告]
发表于 2012-09-26 12:45 |只看该作者
回复 5# dn833

论坛徽章:
0
9 [报告]
发表于 2012-09-26 12:46 |只看该作者
回复 5# dn833


    grep -Po '.*(?=##)'
你好,请问这条命令是什么意思呢,刚才百度谷歌了下都没有查到-Po/-oP参数,麻烦可以解释下吗

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
10 [报告]
发表于 2012-09-26 13:24 |只看该作者
本帖最后由 dn833 于 2012-09-26 13:25 编辑

回复 9# yokto2012

P是让grep支持perl正则
o是仅仅匹配
后面的(?=)是正则里的零宽断言
grep -Po '.*(?=##)'
这句话的意思是,仅仅(-o)匹配每行所有##前边的全部字符,因为正则的贪婪性所以就匹配到了每行最后一组##之前的全部字符。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP