免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: yjh777
打印 上一主题 下一主题

[文本处理] shell yaml 文本解析问题 [复制链接]

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
11 [报告]
发表于 2014-05-30 08:51 |只看该作者
回复 9# damcool

http://zh.wikipedia.org/zh-cn/YAML
   

论坛徽章:
2
白羊座
日期:2013-11-18 19:52:42辰龙
日期:2014-09-07 07:46:06
12 [报告]
发表于 2014-05-30 09:38 |只看该作者
本帖最后由 damcool 于 2014-05-30 09:40 编辑

我承认纯bash没办法解析,好像是因为字符"\"会在变量传递时丢失。晕!下面是awk解决方案,顺便带了几个极端例子测试。有兴趣的朋友可以用以测试自己的代码。
  1. echo 'type: abc,  attr: x,y,z,  name: kskdf sdf'|awk -F "," '{for (i=1; i<=NF;i++){t=$i;gsub(/^[[:blank:]]+/,"",t);if (match(t,/[^:]+:[^:]+/) && !match(t,/^\"/)){t=k;gsub(/\\\"/,"",t);n=length(t);gsub(/\"/,"",t);n=(n-length(t))%2;if (n<1){ if (j>0) print j"-->"k;j++;k=$i;gsub(/^[[:blank:]]+/,"",k)} else k=k","$i}else k=k","$i} if (j>0) print j"-->"k}'

  2. echo 'type: abc,  attr: "x,y,z",  name: kskdf sdf'|awk -F "," '{for (i=1; i<=NF;i++){t=$i;gsub(/^[[:blank:]]+/,"",t);if (match(t,/[^:]+:[^:]+/) && !match(t,/^\"/)){t=k;gsub(/\\\"/,"",t);n=length(t);gsub(/\"/,"",t);n=(n-length(t))%2;if (n<1){ if (j>0) print j"-->"k;j++;k=$i;gsub(/^[[:blank:]]+/,"",k)} else k=k","$i}else k=k","$i} if (j>0) print j"-->"k}'

  3. echo 'type: abc,  attr: "x,y,z::\"$@#%^&",  name: kskdf sdf'|awk -F "," '{for (i=1; i<=NF;i++){t=$i;gsub(/^[[:blank:]]+/,"",t);if (match(t,/[^:]+:[^:]+/) && !match(t,/^\"/)){t=k;gsub(/\\\"/,"",t);n=length(t);gsub(/\"/,"",t);n=(n-length(t))%2;if (n<1){ if (j>0) print j"-->"k;j++;k=$i;gsub(/^[[:blank:]]+/,"",k)} else k=k","$i}else k=k","$i} if (j>0) print j"-->"k}'

  4. echo 'type: abc,  attr: "x","y","z::\"$@#%^&",  name: kskdf sdf'|awk -F "," '{for (i=1; i<=NF;i++){t=$i;gsub(/^[[:blank:]]+/,"",t);if (match(t,/[^:]+:[^:]+/) && !match(t,/^\"/)){t=k;gsub(/\\\"/,"",t);n=length(t);gsub(/\"/,"",t);n=(n-length(t))%2;if (n<1){ if (j>0) print j"-->"k;j++;k=$i;gsub(/^[[:blank:]]+/,"",k)} else k=k","$i}else k=k","$i} if (j>0) print j"-->"k}'

  5. echo 'type: abc,  attr: x,y,z::\"$@#%^&,  name: kskdf sdf'|awk -F "," '{for (i=1; i<=NF;i++){t=$i;gsub(/^[[:blank:]]+/,"",t);if (match(t,/[^:]+:[^:]+/) && !match(t,/^\"/)){t=k;gsub(/\\\"/,"",t);n=length(t);gsub(/\"/,"",t);n=(n-length(t))%2;if (n<1){ if (j>0) print j"-->"k;j++;k=$i;gsub(/^[[:blank:]]+/,"",k)} else k=k","$i}else k=k","$i} if (j>0) print j"-->"k}'
复制代码

论坛徽章:
769
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
13 [报告]
发表于 2014-05-30 09:40 |只看该作者
回复 1# yjh777
个人感觉可以用awk  FPAT?
参考这个帖子http://bbs.chinaunix.net/thread-4125586-1-1.html
本来想试一下的,悲剧的发现自己的awk只有3.1.7,不支持这个特性。

   

论坛徽章:
2
白羊座
日期:2013-11-18 19:52:42辰龙
日期:2014-09-07 07:46:06
14 [报告]
发表于 2014-05-30 10:02 |只看该作者
合并一下RegEx判断。
  1. echo 'type: abc,  attr: "x","y","z::\"$@#%^&",  name: kskdf sdf'|awk -F "," '{for (i=1; i<=NF;i++){t=$i;gsub(/^[[:blank:]]+/,"",t);if (match(t,/^[^\":][^:]*:[^:]+/)) {t=k;gsub(/\\\"/,"",t);n=length(t);gsub(/\"/,"",t);n=(n-length(t))%2;if (n<1){ if (j>0) print j"-->"k;j++;k=$i;gsub(/^[[:blank:]]+/,"",k)} else k=k","$i}else k=k","$i} if (j>0) print j"-->"k}'
复制代码

论坛徽章:
84
每日论坛发贴之星
日期:2015-12-29 06:20:00每日论坛发贴之星
日期:2016-01-16 06:20:00每周论坛发贴之星
日期:2016-01-17 22:22:00程序设计版块每日发帖之星
日期:2016-01-20 06:20:00每日论坛发贴之星
日期:2016-01-20 06:20:00程序设计版块每日发帖之星
日期:2016-01-21 06:20:00每日论坛发贴之星
日期:2016-01-21 06:20:00程序设计版块每日发帖之星
日期:2016-01-23 06:20:00程序设计版块每日发帖之星
日期:2016-01-31 06:20:00数据库技术版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-14 06:20:00
15 [报告]
发表于 2014-05-30 11:12 |只看该作者
回复 10# LikeLx

看起来很好啊; ) 多谢,我再多测试测试.

自己想出来的shell方法:
parse_y() {
        local ys="$*"
        (set -- $ys
        for i; do
                if echo "$i"|grep -q ",$"; then
                        echo "${i%,}"
                else
                        echo -n "$i "
                fi
        done)
}

[root@221 ~]# parse_y  'type: abc,  attr: "x,y,z::\"$@#%^&",  name: kskdf sdf'
type: abc
attr: "x,y,z::\"$@#%^&"
name: kskdf sdf
   

论坛徽章:
84
每日论坛发贴之星
日期:2015-12-29 06:20:00每日论坛发贴之星
日期:2016-01-16 06:20:00每周论坛发贴之星
日期:2016-01-17 22:22:00程序设计版块每日发帖之星
日期:2016-01-20 06:20:00每日论坛发贴之星
日期:2016-01-20 06:20:00程序设计版块每日发帖之星
日期:2016-01-21 06:20:00每日论坛发贴之星
日期:2016-01-21 06:20:00程序设计版块每日发帖之星
日期:2016-01-23 06:20:00程序设计版块每日发帖之星
日期:2016-01-31 06:20:00数据库技术版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-14 06:20:00
16 [报告]
发表于 2014-05-30 11:15 |只看该作者
回复 14# damcool


非常感谢damcool, 热心帮忙; )
我看10楼的写法很简单, 也请帮忙review一下, awk的splite()是不是直接可以解决这种问题/

论坛徽章:
84
每日论坛发贴之星
日期:2015-12-29 06:20:00每日论坛发贴之星
日期:2016-01-16 06:20:00每周论坛发贴之星
日期:2016-01-17 22:22:00程序设计版块每日发帖之星
日期:2016-01-20 06:20:00每日论坛发贴之星
日期:2016-01-20 06:20:00程序设计版块每日发帖之星
日期:2016-01-21 06:20:00每日论坛发贴之星
日期:2016-01-21 06:20:00程序设计版块每日发帖之星
日期:2016-01-23 06:20:00程序设计版块每日发帖之星
日期:2016-01-31 06:20:00数据库技术版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-14 06:20:00
17 [报告]
发表于 2014-05-30 11:21 |只看该作者
回复 7# jason680

Hi jason680 很棒的状态机解析思路; 非常感谢!

论坛徽章:
84
每日论坛发贴之星
日期:2015-12-29 06:20:00每日论坛发贴之星
日期:2016-01-16 06:20:00每周论坛发贴之星
日期:2016-01-17 22:22:00程序设计版块每日发帖之星
日期:2016-01-20 06:20:00每日论坛发贴之星
日期:2016-01-20 06:20:00程序设计版块每日发帖之星
日期:2016-01-21 06:20:00每日论坛发贴之星
日期:2016-01-21 06:20:00程序设计版块每日发帖之星
日期:2016-01-23 06:20:00程序设计版块每日发帖之星
日期:2016-01-31 06:20:00数据库技术版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-14 06:20:00
18 [报告]
发表于 2014-05-30 11:29 |只看该作者
真的非常感谢大家,帮忙想办法;

但是最佳答案只能有一个,目前看10#给出的写法最简单,而且能满足目前的处理,,

论坛徽章:
2
白羊座
日期:2013-11-18 19:52:42辰龙
日期:2014-09-07 07:46:06
19 [报告]
发表于 2014-05-30 16:34 |只看该作者
你试试看在x,y,z任一逗号后加个空格试试看结果如何?
yjh777 发表于 2014-05-30 11:12
回复 10# LikeLx

看起来很好啊; ) 多谢,我再多测试测试.

论坛徽章:
84
每日论坛发贴之星
日期:2015-12-29 06:20:00每日论坛发贴之星
日期:2016-01-16 06:20:00每周论坛发贴之星
日期:2016-01-17 22:22:00程序设计版块每日发帖之星
日期:2016-01-20 06:20:00每日论坛发贴之星
日期:2016-01-20 06:20:00程序设计版块每日发帖之星
日期:2016-01-21 06:20:00每日论坛发贴之星
日期:2016-01-21 06:20:00程序设计版块每日发帖之星
日期:2016-01-23 06:20:00程序设计版块每日发帖之星
日期:2016-01-31 06:20:00数据库技术版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-14 06:20:00
20 [报告]
发表于 2014-05-31 18:51 |只看该作者
回复 19# damcool

噢!! 没仔细看,原来是这样啊,被误导了还以为split()会智能把""当一个单词呢。
最佳答案给错了,对不起大家啊,,


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP