免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 44751 | 回复: 16
打印 上一主题 下一主题

怎样分隔csv文件 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-07-27 17:12 |只看该作者 |倒序浏览
my $csv1 = 'atp1 CDS,CDS,"92,220","93,761","1,542",3,forward';
my $csv2 = 'atp1 exon 2,exon,"93,209","93,269",61,1,forward';

将上述两个字符串分隔成两个数组 my $csv1 split= @temp1:
                                                                    atp1 CDS
                                                                    CDS
                                                                   "92,220"
                                                                   "93,761"
                                                                   "1,542"
                                                                    3
                                                                    forward
my $csv2 split = @temp2:
                         atp1 exon 2
                         exon
                         "93,209"
                         "93,269"
                         61
                         1
                         forward

哪位大神能帮助我写这个正则表达式啊?


求职 : 软件工程师
论坛徽章:
3
程序设计版块每日发帖之星
日期:2015-10-07 06:20:00程序设计版块每日发帖之星
日期:2015-12-13 06:20:00程序设计版块每日发帖之星
日期:2016-05-05 06:20:00
2 [报告]
发表于 2016-07-27 17:19 |只看该作者
使用现成的完美解决方案, 用模块: cpan.org --> search CSV

论坛徽章:
0
3 [报告]
发表于 2016-07-27 17:29 |只看该作者
请问能否具体一点,我不明白,谢谢啦
回复 2# 104359176


   

求职 : 软件工程师
论坛徽章:
3
程序设计版块每日发帖之星
日期:2015-10-07 06:20:00程序设计版块每日发帖之星
日期:2015-12-13 06:20:00程序设计版块每日发帖之星
日期:2016-05-05 06:20:00
4 [报告]
发表于 2016-07-27 20:26 |只看该作者
就是使用模块,我帮你查一下:
  1. use Text::CSV;

  2. my @rows;
  3. my $csv = Text::CSV->new ( { binary => 1 } )  # should set binary attribute.
  4.                 or die "Cannot use CSV: ".Text::CSV->error_diag ();

  5. open my $fh, "<:encoding(utf8)", "test.csv" or die "test.csv: $!";
  6. while ( my $row = $csv->getline( $fh ) ) {
  7.     $row->[2] =~ m/pattern/ or next; # 3rd field should match
  8.     push @rows, $row;
  9. }
  10. $csv->eof or $csv->error_diag();
  11. close $fh;

  12. $csv->eol ("\r\n");

  13. open $fh, ">:encoding(utf8)", "new.csv" or die "new.csv: $!";
  14. $csv->print ($fh, $_) for @rows;
  15. close $fh or die "new.csv: $!";
复制代码
首先要安装这个模块,如果是 activeperl + windows:
  1. > ppm install Text::CSV
复制代码
如果这个不行,下面的办法在所有的平台上都OK:
  1. > cpan
  2. .....
  3. > install Text::CSV
复制代码
安装好了以后,就可以执行上面的代码了,前提是你吧你的 CSV 内容写到文件中, 替换掉代码中的文件名.

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
5 [报告]
发表于 2016-07-27 20:52 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. while (<DATA>){
  5.     foreach (split (/,("[^"]*")?/)){
  6.         print $_ ? "$_\n" : "";
  7.     }
  8. }

  9. __DATA__
  10. atp1 CDS,CDS,"92,220","93,761","1,542",3,forward
  11. atp1 exon 2,exon,"93,209","93,269",61,1,forward
复制代码
perl abc.pl
-------------------------------------------------------
atp1 CDS
CDS
"92,220"
"93,761"
"1,542"
3
forward

atp1 exon 2
exon
"93,209"
"93,269"
61
1
forward

论坛徽章:
0
6 [报告]
发表于 2016-07-27 23:15 |只看该作者
强人,很简单的实现方法,非常感谢
回复 5# sunzhiguolu


   

论坛徽章:
0
7 [报告]
发表于 2016-07-27 23:17 |只看该作者
大神,谢谢你打这么多字,详细指导我,受教了!
回复 4# 104359176


   

论坛徽章:
0
8 [报告]
发表于 2016-08-05 12:58 |只看该作者
  1. #!/usr/bin/perl

  2. use warnings;
  3. use strict;

  4. my $csv1 = 'atp1 CDS, CDS, "92,220" , "93,761", "1,542", 3, forward';
  5. my $csv2 = 'atp1 exon 2, exon, "93,209", "93,269", 61, 1, forward';
  6. my @items = ( \$csv1, \$csv2 );
  7. foreach my $item (@items) {
  8.         my @csv_temp = split /"/, ${$item};
  9.         my @temp = map {
  10.                 if (/^\d+,\d+/m) {
  11.                         $_;
  12.                 } else {
  13.                         split /,/, $_;
  14.                 }
  15.         } @csv_temp;
  16.         print $_, "   ", for @temp;
  17. }
复制代码
仅供楼主参考咯~

论坛徽章:
1
15-16赛季CBA联赛之北控
日期:2016-08-05 14:22:52
9 [报告]
发表于 2016-08-05 14:10 |只看该作者
本帖最后由 唐归来 于 2016-08-05 14:20 编辑

回复 5# sunzhiguolu
厉害!

   

论坛徽章:
1
IT运维版块每日发帖之星
日期:2016-08-11 06:20:00
10 [报告]
发表于 2016-08-08 21:08 |只看该作者
看看了。。。。。。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP