- 论坛徽章:
- 0
|
各位坛子里的大神们,我有个N个txt文件想转换成csv文件,但其中第五列输出系统时间内容 如下所示:"<?xml version=""1.0""?>\n<Clock xmlns:dt=""urn:schemas-microsoft-com:datatypes""><DateUtc dt:dt=""string"">2010-12-15T20:16:16Z</DateUtc></StartTime><FrequencyChanges><FrequencyChange><Frequency dt:dt=""r8"">2992500000</Frequency><Timestamp dt:dt=""r8"">128810860588404</Timestamp><Current dt:dt=""r8"">0</Current><DateUtc dt:dt=""string"">2010-12-15T20:16:16Z</DateUtc></FrequencyChange></FrequencyChanges></Clock>\n" 列名叫做Clock.information
在TXT到CSV格式转化的时候如果用tr ‘ ’ ‘,’这一列会变成很多列,因为里面有空格。所以我想在转换CSV文件前,在TXT格式中把这一列删掉。我目前想出的方法是把header和文件体分开,header文件 cut -d -f5,然后剩下的body cut -d -f5-17。这个方法大部分文件是可以完成的,但是因为时间不同当有些TXT文件中第五列的格式跟大部分稍有不同,多几个空格,cut方法就会出错。
所以我想不知道有没有一种sed方法可以直接删除两个引号之间的所有内容“”
不知道哪位大神能指点一二,小女子感激不尽!!!!
|
|