免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2114 | 回复: 2
打印 上一主题 下一主题

[文本处理] sed删除两个引号中的所有内容 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2019-03-20 09:29 |只看该作者 |倒序浏览
各位坛子里的大神们,我有个N个txt文件想转换成csv文件,但其中第五列输出系统时间内容 如下所示:"<?xml version=""1.0""?>\n<Clock xmlns:dt=""urn:schemas-microsoft-com:datatypes""><DateUtc dt:dt=""string"">2010-12-15T20:16:16Z</DateUtc></StartTime><FrequencyChanges><FrequencyChange><Frequency dt:dt=""r8"">2992500000</Frequency><Timestamp dt:dt=""r8"">128810860588404</Timestamp><Current dt:dt=""r8"">0</Current><DateUtc dt:dt=""string"">2010-12-15T20:16:16Z</DateUtc></FrequencyChange></FrequencyChanges></Clock>\n" 列名叫做Clock.information

在TXT到CSV格式转化的时候如果用tr ‘ ’ ‘,’这一列会变成很多列,因为里面有空格。所以我想在转换CSV文件前,在TXT格式中把这一列删掉。我目前想出的方法是把header和文件体分开,header文件 cut -d -f5,然后剩下的body cut -d -f5-17。这个方法大部分文件是可以完成的,但是因为时间不同当有些TXT文件中第五列的格式跟大部分稍有不同,多几个空格,cut方法就会出错。
所以我想不知道有没有一种sed方法可以直接删除两个引号之间的所有内容“”
不知道哪位大神能指点一二,小女子感激不尽!!!!



论坛徽章:
8
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:0615-16赛季CBA联赛之北控
日期:2021-03-30 15:53:34
2 [报告]
发表于 2019-03-20 12:50 |只看该作者
  1. sed -E 's/".*"//' file
复制代码

论坛徽章:
0
3 [报告]
发表于 2019-03-20 17:02 |只看该作者
回复 2# cfwyy

非常感谢!!!!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP