免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4763 | 回复: 8
打印 上一主题 下一主题

[文本处理] shell sed 删除替换双引号之间的符号 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-08-27 11:56 |只看该作者 |倒序浏览
本帖最后由 229147123 于 2015-08-27 11:57 编辑

shell sed 删除替换双引号之间的符号

例如:
asss"ssdf,dfd",sdfdsf,dfs
结果
asss"ssdfdfd",sdfdsf,dfs或者asss"ssdf||dfd",sdfdsf,dfs

论坛徽章:
12
IT运维版块每日发帖之星
日期:2015-11-17 06:20:00程序设计版块每日发帖之星
日期:2016-01-19 06:20:0015-16赛季CBA联赛之江苏
日期:2016-01-17 15:31:3915-16赛季CBA联赛之上海
日期:2016-01-16 15:44:3015-16赛季CBA联赛之浙江
日期:2016-01-15 20:38:1815-16赛季CBA联赛之北京
日期:2016-01-09 14:30:15CU十四周年纪念徽章
日期:2016-01-07 12:31:5115-16赛季CBA联赛之四川
日期:2016-01-01 11:49:1515-16赛季CBA联赛之深圳
日期:2015-12-24 14:23:4115-16赛季CBA联赛之山西
日期:2015-12-15 16:22:31技术图书徽章
日期:2015-12-10 17:41:0015-16赛季CBA联赛之北控
日期:2016-02-03 10:03:24
2 [报告]
发表于 2015-08-27 12:12 |只看该作者
sed -r 's/(".*),([^"]*")/\1\2/'
sed -r 's/(".*),([^"]*")/\1||\2/'

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
3 [报告]
发表于 2015-08-27 12:31 |只看该作者
回复 1# 229147123


    需要二次替换呀, 这个 Perl 做起来倒是很方便:

$ echo 'asss"ssdf,dfd","abc;def";sdfdsf,dfs' | perl -pE 's/"([^"]*)"/ $a = $1; $a =~ s!\W!!g; "\"$a\"" /eg'
asss"ssdfdfd","abcdef";sdfdsf,dfs

论坛徽章:
7
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:57:092015小元宵徽章
日期:2015-03-06 15:58:18程序设计版块每日发帖之星
日期:2015-08-09 06:20:00每日论坛发贴之星
日期:2015-08-09 06:20:00程序设计版块每日发帖之星
日期:2015-08-22 06:20:00程序设计版块每日发帖之星
日期:2015-08-27 06:20:00
4 [报告]
发表于 2015-08-27 13:13 |只看该作者
一行如果有多个这个就挺麻烦了回复 2# sync_1521


   

论坛徽章:
20
卯兔
日期:2015-01-26 22:05:142015亚冠之萨济拖拉机
日期:2015-09-10 15:15:282015亚冠之阿尔希拉尔
日期:2015-09-25 17:37:53程序设计版块每日发帖之星
日期:2015-10-03 06:20:00程序设计版块每日发帖之星
日期:2015-12-09 06:20:00CU十四周年纪念徽章
日期:2015-12-17 09:07:15程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:342015亚冠之广州富力
日期:2015-08-27 19:29:56每日论坛发贴之星
日期:2015-08-26 06:20:002015亚冠之阿尔希拉尔
日期:2015-05-18 17:26:27
5 [报告]
发表于 2015-08-27 13:24 |只看该作者
本帖最后由 songyc_2015 于 2015-08-27 13:36 编辑

回复 1# 229147123
  1. (tcp)~/priv/syc> cat file
  2. asss,"aaa[bbb",sdfdsf,dfs
  3. asss,"aaa,bbb;ccc",sdfdsf,dfs
  4. asss,"aaa|bbb","aaa:bbb",sdfdsf,dfs
  5. (tcp)~/priv/syc> sed -r ':1;s#"(\w+)\W([^",]+)"#"\1\2"#;t1' file
  6. asss,"aaabbb",sdfdsf,dfs
  7. asss,"aaabbbccc",sdfdsf,dfs
  8. asss,"aaabbb","aaabbb",sdfdsf,dfs
复制代码

论坛徽章:
0
6 [报告]
发表于 2015-08-27 18:45 |只看该作者
大神,能解释下你sed里面的":","#","t"都是啥意思么
回复 5# songyc_2015


   

论坛徽章:
20
卯兔
日期:2015-01-26 22:05:142015亚冠之萨济拖拉机
日期:2015-09-10 15:15:282015亚冠之阿尔希拉尔
日期:2015-09-25 17:37:53程序设计版块每日发帖之星
日期:2015-10-03 06:20:00程序设计版块每日发帖之星
日期:2015-12-09 06:20:00CU十四周年纪念徽章
日期:2015-12-17 09:07:15程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:342015亚冠之广州富力
日期:2015-08-27 19:29:56每日论坛发贴之星
日期:2015-08-26 06:20:002015亚冠之阿尔希拉尔
日期:2015-05-18 17:26:27
7 [报告]
发表于 2015-08-27 19:24 |只看该作者
回复 6# foreverys
大神,能解释下你sed里面的":","#","t"都是啥意思么

:表示定义标签,如:1表示定义标签1
s###与s///一样
t:表示前面的s替换成功,则跳转到标签1

ps:man sed/info sed

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
8 [报告]
发表于 2015-08-29 23:41 |只看该作者
sed -r 's/("[^"]+),([^"]+")/\1\2/g' file

论坛徽章:
6
处女座
日期:2014-04-02 16:07:17酉鸡
日期:2014-04-14 10:09:22子鼠
日期:2014-04-17 11:57:30辰龙
日期:2014-09-01 17:14:08戌狗
日期:2014-10-28 12:25:54未羊
日期:2014-11-14 11:31:58
9 [报告]
发表于 2015-08-31 18:15 |只看该作者
  1. awk 'BEGIN{FS=OFS="\""} {for(i=2;i<=NF;i=i+2){$i=gensub(/,/,"","g",$i)};print $0}'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP