免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: 啵啵油菜
打印 上一主题 下一主题

[文本处理] awk 反斜杠\ 分隔符问题 求助 [复制链接]

论坛徽章:
9
2015亚冠之大阪钢巴
日期:2015-06-04 11:47:30丑牛
日期:2015-01-22 15:49:26巳蛇
日期:2015-01-22 10:11:18巨蟹座
日期:2014-11-20 10:55:03天蝎座
日期:2014-11-16 22:10:26处女座
日期:2014-11-16 11:01:10申猴
日期:2014-09-19 11:12:37双鱼座
日期:2014-07-25 10:09:54程序设计版块每日发帖之星
日期:2015-08-24 06:20:00
11 [报告]
发表于 2014-10-15 16:40 |只看该作者
回复 9# 啵啵油菜


让那个区域等于"" ;在输出
awk '{$2=""}1'

论坛徽章:
3
丑牛
日期:2014-09-13 18:19:22摩羯座
日期:2014-10-10 17:43:02水瓶座
日期:2014-10-16 01:00:22
12 [报告]
发表于 2014-10-15 17:43 |只看该作者
学生党:飘过~还是python省事儿..直接r原意解决~
$ python
Python 2.7.8 (default, Jul 25 2014, 14:04:36)
[GCC 4.8.3] on cygwin
Type "help", "copyright", "credits" or "license" for more information.

>>> s=r'I\002655145771\002ff80808148f9345c01490c6f6e8d6939\002ZmY4MDgwODE0OGY5MzQ1YzAxNDkwYzZmNmU4ZDY5Mzk'
>>> s.split(r'\002')
['I', '655145771', 'ff80808148f9345c01490c6f6e8d6939', 'ZmY4MDgwODE0OGY5MzQ1YzAxNDkwYzZmNmU4ZDY5Mzk']

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
13 [报告]
发表于 2014-10-15 21:55 |只看该作者
@啵啵油菜 希望下面的解释对你有帮助。
对于  -F '\\\\002'   shell会将 \\\\002 传给 awk
awk根据语法规则将其中的两个红色\ 视为转意符,于是F最终得到的是\\002
然后,由于awk是将变量FS看作是一个正则表示试的。所以\\002的最终含义是实际字符串  \002


展开一下
如果-F后面的字符窜不加单引号,那么要  :
awk  -F\\\\\\\\002 '{print $1}' 才能符合要求。
因为由于没有单引号的保护,shell会将\\\\\\\\002 解释为\\\\002 再传给 awk

论坛徽章:
0
14 [报告]
发表于 2014-10-15 22:15 |只看该作者
linux-hlfr:~ # echo "I\002655145771\002ff80808148f9345c01490c6f6e8d6939\002ZmY4MDgwODE0OGY5MzQ1YzAxNDkwYzZmNmU4ZDY5Mzk" | awk -F[\002] '{print $1}'
I\

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
15 [报告]
发表于 2014-10-20 17:56 |只看该作者
回复 13# cao627
赞!


   

论坛徽章:
0
16 [报告]
发表于 2014-10-20 21:46 |只看该作者
echo "I\002655145771\002ff80808148f9345c01490c6f6e8d6939\002ZmY4MDgwODE0OGY5MzQ1YzAxNDkwYzZmNmU4ZDY5Mzk" |awk -F"\\\\\\\\002" '{print $1}'

论坛徽章:
0
17 [报告]
发表于 2014-10-21 15:08 |只看该作者
想确切的了解这些转义符的原理,除了不同的工具,还有不同的shell,所以最粗暴的办法的就是一个劲加就是了,一个不够就俩,
--我最多的纪录是17个反斜杠,eval/·/awk/gsub,我只知道结果可用,你让我解释,我真说不明白
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP