免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2371 | 回复: 8
打印 上一主题 下一主题

SHELL编程 文件解析的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-01-21 11:54 |只看该作者 |倒序浏览
需要解析一个文件(pnote_file),格式如下.
"SECTION:<str>{ "   和  "}END"分别做为起始和结束的关键字.

读取文件的每一个行,如果是section里面的内容,把它显示出来.
我觉得用perl没有问题, 每次用正则表达式判断当前str的内容.
再用一个flag来标识起始和结束就ok了.

在parse_pnote() 我写了大概的perl.
但是, 需要用shell ( #!/bin/sh ).

我对shell还不是很熟, 请大家指点一下.
多谢!

================================================
pnote_file:

SECTION:1{
This is section 1 infor
}END

SECTION:2{
This is section 2 infor
}END


===========================================
#!/bin/sh
flag=0
infor_str=""


#sub function
parse_pnote()
{
        line_str=$*
        echo "The current str is : $line_str"

        if [ $line_str=~/SECTION(.*){(\s*)$/  ] && (flag=0);then
               flag=1
        else
             if [$line_str=~/SECTION(.*){(\s*)$/  &&  (flag=1)];then
                       #出错   上一个SECTION没有END匹配
             else
                      #记录信息 infor_str
             fi
        fi

       if [ $line_str=~/}END/ && (flag=1)]
             flag=0
             echo "the infor is $infor_str"
             infor_str=""
       fi

}

#main
while read LINE ; do
                       parse_pnote $LINE;                       
done < $pnote_file

论坛徽章:
0
2 [报告]
发表于 2011-01-21 12:20 |只看该作者
如果你格式是好的

直接

grep -v "^SECTION:*{" filename|grep -v "^}END"

呵呵

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
3 [报告]
发表于 2011-01-21 13:08 |只看该作者
回复 1# thyswallow


    这样行么?
  1. cat file
  2. SECTION:1{
  3. This is section 1 infor
  4. }END

  5. SECTION:2{
  6. This is section 2 infor
  7. }END

  8. awk '/SECTION:/{p=1;next}/\}END/{p=0}p' file
  9. This is section 1 infor
  10. This is section 2 infor

复制代码

论坛徽章:
0
4 [报告]
发表于 2011-01-21 18:39 |只看该作者
awk '/SECTION:/{p=1;next}/\}END/{p=0}p' file
谁能解释一下最后那p的意思吗?谢谢啊

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
5 [报告]
发表于 2011-01-21 21:06 |只看该作者
sed -rn '/SECTION:.+{/ba;d;:a n;/}END/d;p;ba'

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
6 [报告]
发表于 2011-01-21 21:06 |只看该作者
sed -rn '/SECTION:.+{/ba;d;:a n;/}END/d;p;ba'

论坛徽章:
0
7 [报告]
发表于 2011-01-21 22:42 |只看该作者
回复 3# yinyuemi


     多谢回复!
   
   脚本:testawk.
    但是运行出错。 请问我哪里写错了?
   您是如何得到这两行输出的?
   ====================================
   #!/bin/sh

     file=tmpfile

     cat $file | awk '/SECTION:/{p=1;next}/\}END/{p=0}p'

     ====================================
      运行出错:

   > ./testawk
         awk: syntax error near line 1
         awk: bailing out near line 1

    > cat tmpfile
         SECTION:1{
                  This is section 1 infor
          }END

         SECTION:2{
                  This is section 2 infor
         }END

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
8 [报告]
发表于 2011-01-22 01:00 |只看该作者
回复 5# java_html


   p可以看出一个打印判断的值,1为真则打印,0为假则不打印。
http://bbs.chinaunix.net/viewthr ... p;extra=&page=1

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
9 [报告]
发表于 2011-01-22 01:06 |只看该作者
回复  yinyuemi


     多谢回复!
   
   脚本:testawk.
    但是运行出错。 请问我哪里写错了? ...
thyswallow 发表于 2011-01-21 22:42



    我这里没问题,

  1. cat file
  2. SECTION:1{
  3.                   This is section 1 infor
  4.           }END

  5.          SECTION:2{
  6.                   This is section 2 infor
  7.          }END


  8. cat test.sh
  9. #!/bin/sh

  10.      file=file

  11.      cat $file | awk '/SECTION:/{p=1;next}/\}END/{p=0}p'


  12. ./test.sh
  13.                   This is section 1 infor
  14.                   This is section 2 infor

复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP