免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2114 | 回复: 8

[文本处理] 求助,以边界标识 循环获取 文本块 [复制链接]

论坛徽章:
0
发表于 2012-10-14 19:04 |显示全部楼层
EXPORT
int functionName1(string param1,
                           int     param2,
                          string  param3);
EXPORT
int functionName2(string param1,
                           int     param2,
                          string  param3);
EXPORT int functionName3(
                          string param1,
                           int     param2,
                          string  param3
                          int       param4);
EXPORT
int functionName4(string param1,
                           int     param2,
                          string  param3);

像这样的文本 ,我要每次读一块含有EXPORT的文本块,提取 函数名 和参数

而且由于格式不怎么统一 ,好头疼啊

求助大牛  给 个 方法 ~!

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
发表于 2012-10-14 21:13 |显示全部楼层
  1. awk 'BEGIN{RS="EXPORT";OFS="\t"}NR>1{$1=$1;gsub(/[(),;int string]/,"");print}'
复制代码

论坛徽章:
0
发表于 2012-10-14 21:15 |显示全部楼层
本帖最后由 personball 于 2012-10-14 21:17 编辑

回复 1# zwrvvv

try
    grep -A1 "EXPORT" file

o ,不对。。。 有些还在同一行的- -。。

论坛徽章:
0
发表于 2012-10-15 00:50 |显示全部楼层
  1. #!perl -w
  2. use strict;

  3. undef $/;
  4. while( <> ){
  5.      print split /EXPORT/;
  6. }
复制代码

论坛徽章:
0
发表于 2012-10-15 09:02 |显示全部楼层
回复 2# dn833


    gsub(/[(),;int string]/,"") 用的真好~~

论坛徽章:
0
发表于 2012-10-15 10:35 |显示全部楼层
本帖最后由 menulst 于 2012-10-15 10:36 编辑
dn833 发表于 2012-10-14 21:13


这里gsub里面不应该用字符组。否则单个字符都会被替换为空。
  1. awk 'BEGIN{RS="EXPORT"; OFS="\t"} NR > 1 {$1=$1; gsub(/\(|\)|,|;|int(\s|\t)*|string(\s|\t)*/, ""); print}' ufile
复制代码

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
发表于 2012-10-15 11:26 |显示全部楼层
回复 6# menulst


    6楼所言极是,比我那个严谨多了,想你学习哈

论坛徽章:
0
发表于 2012-10-15 12:02 |显示全部楼层
dn833 发表于 2012-10-15 11:26
回复 6# menulst


互相学习。

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2012-10-15 12:54 |显示全部楼层
回复 1# zwrvvv

                          string  param3,  <== does it lose a common sign or not?
                          int       param4);
   

$ awk -vRS='EXPORT' -F"[(,)]" '{gsub("[ \t\n\r]+"," ");for(n=0;n++<NF-1;){sub("^ ","",$n);t=split($n,a," ");printf n==NF-1?a[t]"\n":a[t]","}}' FILE
functionName1,param1,param2,param3
functionName2,param1,param2,param3
functionName3,param1,param2,param3,param4
functionName4,param1,param2,param3

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP