免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1970 | 回复: 7
打印 上一主题 下一主题

[文本处理] 多行按分隔符取域 [复制链接]

论坛徽章:
1
15-16赛季CBA联赛之佛山
日期:2016-04-26 13:26:26
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-01-18 09:29 |只看该作者 |倒序浏览
有个函数student,我想把原有逻辑注释掉,并重写下,即把这个函数的每个参数都取出来赋给一个结构体,由于每个程序员开发的不同导致这些参数可能不在一行中,但肯定是以逗号隔开的,
原:
abc = int student(name,sex,
         height,
         weight,
         address);

我的目标:
/*comment by xxx
abc = int student(name,sex,
         height,
         weight,
         address);
comment by xxx*/
/*add beg by xxx
A.stu_name = name;
A.stu_sex = sex;
A.stu_weight = weight;
A.stu_add = address;
abc = int student(A.stu_name,A.stu_sex,A.stu_weight,A.stu_add);
add end by xxx*/
请问怎么实现?(主要是问怎样把不在同一行的数据按照某种分隔符取出来)



论坛徽章:
1
15-16赛季CBA联赛之佛山
日期:2016-04-26 13:26:26
2 [报告]
发表于 2017-01-18 10:34 |只看该作者
有人没,怎么弄

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
3 [报告]
发表于 2017-01-18 11:34 |只看该作者
回复 2# t069064449
能否把你希望提取的内容贴出来看下。

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
4 [报告]
发表于 2017-01-18 11:50 |只看该作者
没见你的示例文件中包含函数啊,那个 student 不是一个 int 类型的 Struct 吗?

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
5 [报告]
发表于 2017-01-18 12:21 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. local $/ = ';';
  5. while (<DATA>){
  6.     next if (!/\bstudent\(([^()]+)/);
  7.     print join ("\t", grep {/\A\w/} split (/\s*,\s*/, $1)), "\n";
  8. }

  9. __DATA__
  10. /*comment by xxx
  11. abc = int student(name,sex,
  12.          height,
  13.          weight,
  14.          address);
  15. comment by xxx*/
  16. /*add beg by xxx
  17. A.stu_name = name;
  18. A.stu_sex = sex;
  19. A.stu_weight = weight;
  20. A.stu_add = address;
  21. abc = int student(A.stu_name,A.stu_sex,A.stu_weight,A.stu_add);
  22. add end by xxx*/
复制代码

perl abc.pl
------------------------------
name    sex     height  weight  address
A.stu_name      A.stu_sex       A.stu_weight    A.stu_add

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
6 [报告]
发表于 2017-01-18 12:49 |只看该作者
回复 1# t069064449

what do you want ...

$ awk -vRS="\0" -F' *, *' '{gsub("^[^(]+[(]|).+$|\n","");$1=$1;for(n=1;n<=NF;++n)print "$"n"="$n}' FILE
$1=name
$2=sex
$3=height
$4=weight
$5=address

$ awk -vRS="\0" -F' *, *' '{gsub("^[^(]+[(]|).+$|\n","");$1=$1;for(n=1;n<=NF;++n)print "A.stu_"$n" = "$n";"}' FILE
A.stu_name = name;
A.stu_sex = sex;
A.stu_height = height;
A.stu_weight = weight;
A.stu_address = address;



论坛徽章:
1
15-16赛季CBA联赛之佛山
日期:2016-04-26 13:26:26
7 [报告]
发表于 2017-01-18 16:06 |只看该作者
说的简单一点吧。有个1.txt,内容为
abc = int student(name,sex,
         height,
         weight,
         address);
我现在想取出每一个student(,,,,)中每个逗号隔开的量,应该怎么做?

论坛徽章:
1
15-16赛季CBA联赛之佛山
日期:2016-04-26 13:26:26
8 [报告]
发表于 2017-01-18 16:12 |只看该作者
回复 6# jason680

可以的,谢谢
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP