免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2013 | 回复: 4
打印 上一主题 下一主题

怎么在双重分隔符的文件里,对字符串进行处理 [复制链接]

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2015-08-06 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-08-18 16:58 |只看该作者 |倒序浏览
本帖最后由 shmtu2005 于 2014-08-18 17:01 编辑

我现在有个文件aa,它是以"|"做分隔的
xx|xx|xxxxx|xxx|aa_1231231_D|xx|xx
xx|xx|xxxxx|xxx|bbc_51231_D|xx|xx
xx|xx|xxxxx|xxx|ddd_31231_D|xx|xx
然后分隔出来的第5个字段内容又是以"_"为分隔符的内容,现在我就是对固定的第5个字段的数据进行处理
我只要以"_"为分隔符的第二个字符串,前面和后面的都剔除掉,比如aa转变之后就变成:
xx|xx|xxxxx|xxx|1231231|xx|xx
xx|xx|xxxxx|xxx|51231|xx|xx
xx|xx|xxxxx|xxx|31231|xx|xx
该怎么弄

论坛徽章:
0
2 [报告]
发表于 2014-08-18 18:05 |只看该作者
方法多的很啊,如果能保证格式一致,替换_为|,按列删除即可,

sed 's/\_/\|/g' aa | awk -F "|" '{$5=NULL;$7=NULL;print}'

此处用 awk,cut 也行

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2015-08-06 06:20:00
3 [报告]
发表于 2014-08-18 20:51 |只看该作者
还有没有更简短点的方法


   

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2015-08-06 06:20:00
4 [报告]
发表于 2014-08-18 21:13 |只看该作者
xm123lw 发表于 2014-08-18 18:05
方法多的很啊,如果能保证格式一致,替换_为|,按列删除即可,

sed 's/\_/\|/g' aa | awk -F "|" '{$5=N ...

你的转换格式的思路不错

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2015-08-06 06:20:00
5 [报告]
发表于 2014-08-19 13:58 |只看该作者
如果用cut,怎么搞
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP