免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3303 | 回复: 16
打印 上一主题 下一主题

小菜鸟遇到 一个 sed 匹配问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-06-12 02:13 |只看该作者 |倒序浏览
本帖最后由 summersunboy 于 2010-06-12 10:04 编辑

原文件(2.txt)是这样的:
  1. ,0,好,a
  2. ,1,好,b
  3. ,2,学,c
  4. ,3,习,d
  5. ,4,天,e
  6. ,5,天,f
  7. ,6,向,g
  8. ,7,上,h
复制代码
处理后要达到的效果是这样:
  1. INSERT (0,"好",a");
  2. INSERT (1,"好",b");
  3. INSERT (2,"学","c");
  4. INSERT (3,"习","d");
  5. INSERT (4,"天",e");
  6. INSERT (5,"天",f");
  7. INSERT (6,"向",g");
  8. INSERT (7,"上",h);
复制代码
我编写的脚本如下:
  1. #!/bin/bash
  2. processTxt()
  3. {
  4. #匹配,开头的行
  5. #将第一个 , 替换成 INSERT (
  6. #并在结尾补上 );
  7. #将第二个 , 替换成 ,"
  8. #将第三个 , 替换成 ","  ## 我这儿遇到问题了
  9. #我在区分 第二个与第三个, 时是以 ,前的字符不为数字区分的
  10. #可是有的字符成功匹配 有的不成功
  11. sed -i "/^,/{
  12.         s/^,/INSERT \(/
  13.         s/\r/\"\);\r/
  14.         s/,/,\"/
  15.     s/\([^\x30-\x39]\),/\1\",\"/
  16.         }" $1
  17.    # s/\([^0-9]\),/\1\",\"/
  18. }

  19. #开始处理
  20. rm -rf 1.txt
  21. cp 2.txt 1.txt
  22. echo "process 1.txt"
  23. processTxt 1.txt
  24. echo "end process"
复制代码
处理后的结果(1.txt)有的匹配成功有的不成功:
  1. INSERT (0,"好,a");
  2. INSERT (1,"好,b");
  3. INSERT (2,"学","c");
  4. INSERT (3,"习","d");
  5. INSERT (4,"天,e");
  6. INSERT (5,"天,f");
  7. INSERT (6,"向,g");
  8. INSERT (7,"上,h);
复制代码
只有 学 和 习 这两个匹配成功了,其它的都不行,这是为什么呢?恳请各位前辈多多指教,先谢过各位了!

论坛徽章:
0
2 [报告]
发表于 2010-06-12 08:39 |只看该作者
本帖最后由 bbgg1983 于 2010-06-12 08:43 编辑
  1. sed -r 's/,(.+),(.+),(.+)/INSERT ("\1","\2","\3");/' 2.txt
复制代码

论坛徽章:
0
3 [报告]
发表于 2010-06-12 08:41 |只看该作者


哇,看花眼了,写的不对

论坛徽章:
0
4 [报告]
发表于 2010-06-12 09:06 |只看该作者
回复 1# summersunboy


    最后一个为啥是11呢?括号少一个?是笔误了还是就是这需求?

论坛徽章:
0
5 [报告]
发表于 2010-06-12 09:40 |只看该作者

  1. awk -F ',' '{print "INSERT","("$2",\""$3"\","$4"\");"}' txt
复制代码

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
6 [报告]
发表于 2010-06-12 09:55 |只看该作者
本帖最后由 expert1 于 2010-06-12 10:12 编辑
  1. # echo ,7,上,h|awk  -F "," '{print "INSERT (,"$2",""\042"$3"\042"",""\042"$4"\42"");"}'  
  2. INSERT (,7,"上","h");
复制代码

论坛徽章:
0
7 [报告]
发表于 2010-06-12 10:05 |只看该作者
不好意思,写错了。现己改正。

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
8 [报告]
发表于 2010-06-12 10:14 |只看该作者
SO EASY!!!!
  1. ~# echo ",0,好,a
  2. ,1,好,b
  3. ,2,学,c
  4. ,3,习,d
  5. ,4,天,e
  6. ,5,天,f
  7. ,6,向,g
  8. ,7,上,h"|awk  -F "," '{print "INSERT (,"$2",""\042"$3"\042"",""\042"$4"\42"");"}'
  9. INSERT (,0,"好","a");
  10. INSERT (,1,"好","b");
  11. INSERT (,2,"学","c");
  12. INSERT (,3,"习","d");
  13. INSERT (,4,"天","e");
  14. INSERT (,5,"天","f");
  15. INSERT (,6,"向","g");
  16. INSERT (,7,"上","h");
复制代码
再挣2分。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
9 [报告]
发表于 2010-06-12 10:19 |只看该作者
sed  判断第几个:

echo '1,2,3,4' | sed 's/,/@/'   # 1是默认值,可以不写
echo '1,2,3,4' | sed 's/,/@/2'
echo '1,2,3,4' | sed 's/,/@/3'

论坛徽章:
0
10 [报告]
发表于 2010-06-12 10:23 |只看该作者
echo ",0,好,a
,1,好,b
,2,学,c
,3,习,d
,4,天,e
,5,天,f
,6,向,g
,7,上,h"|awk  -F "," '{print "INSERT ("$2",""\042"$3"\042"",""\042"$4"\42"");"}'
原来用awk这么简单。
谢谢 expert1
以及iori809 (梦呆呆) 、nomyself 、bbgg1983 (朕本布衣) ,谢谢大家
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP