免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3523 | 回复: 8
打印 上一主题 下一主题

文件批量输出问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-03-24 23:04 |只看该作者 |倒序浏览
有如下格式文件(每列用\t隔开的):

ID_REF  GSM717702       GSM717703       GSM717704       GSM717705       GSM717706
AFFX-BioB-3_at  7.081480562     7.562581761     7.470186073     7.109637558     7.925162211
AFFX-BioB-5_at  7.129958916     7.45944498      7.640895702     7.389891485     8.02738222
AFFX-BioB-M_at  7.271660603     7.932285748     7.903917024     7.751718444     8.232053431


我想得到5个文件,文件名分别是第一行第二列到最后一列的字符,即GSM717702.xls、GSM717703.xls、 GSM717704.xls、 GSM717705.xls、  GSM717706.xls

对应的内容分别是第一列和该文件名对应的列,例如对于文件GSM717702.xls的内容为:
ID_REF  GSM717702
AFFX-BioB-3_at  7.081480562
AFFX-BioB-5_at  7.129958916
AFFX-BioB-M_at  7.271660603

对于文件GSM717703.xls的内容为:
ID_REF  GSM717703
AFFX-BioB-3_at  7.562581761
AFFX-BioB-5_at  7.45944498
AFFX-BioB-M_at  7.932285748


我的文件有很多列,不可能写cut命令一个个把文件cut出来,请教各位大侠,有什么高招。

论坛徽章:
0
2 [报告]
发表于 2014-03-24 23:32 |只看该作者
想到一个比较笨的方法:


#!/usr/bin/perl
use strict;
use warnings;

my $in=shift;
open IN,$in;
my $head =<IN>; chomp $in;
my @a=split /\t+/,$head,2;
my @b=split /\t+/,$a[1];
my $n=2;
foreach my $i (@b){
        system "cut -f1,$n $in > $i.exp";
        $n++;
}

论坛徽章:
0
3 [报告]
发表于 2014-03-24 23:41 |只看该作者

不对,最后一个文件的输出文件名有问题。。。

回复 2# 最爱在深秋


   

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
4 [报告]
发表于 2014-03-25 01:18 |只看该作者
biru:
  1. #!/usr/bin/perl

  2. my ( undef, @file ) = split /\s+/, <DATA>;
  3. my @cache;

  4. while (<DATA>) {
  5.     my ( $affx, @data ) = split;
  6.     for my $i ( 0 .. $#data ) {
  7.         push @{ $cache[$i] }, "$affx\t$data[$i]\n";
  8.     }

  9. }

  10. for my $i ( 0 .. $#file ) {
  11.     open my $fh, '>', "$file[$i].xls";
  12.     print $fh @{ $cache[$i] };
  13. }

  14. __DATA__
  15. ID_REF  GSM717702       GSM717703       GSM717704       GSM717705       GSM717706
  16. AFFX-BioB-3_at  7.081480562     7.562581761     7.470186073     7.109637558     7.925162211
  17. AFFX-BioB-5_at  7.129958916     7.45944498      7.640895702     7.389891485     8.02738222
  18. AFFX-BioB-M_at  7.271660603     7.932285748     7.903917024     7.751718444     8.232053431
复制代码

论坛徽章:
0
5 [报告]
发表于 2014-03-25 11:44 |只看该作者
貌似不行噢~~
回复 4# rubyish


   

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
6 [报告]
发表于 2014-03-25 12:06 |只看该作者
回复 2# 最爱在深秋

why to use chomp $in ??
   

my $head =<IN>; chomp $in;
   

论坛徽章:
0
7 [报告]
发表于 2014-03-25 14:31 |只看该作者
It's a mistake.
Finally I modify it.

#!/usr/bin/perl

use strict;
use warnings;
my $in=shift;

open IN,$in;
my $head =<IN>; chomp $head;
my @a=split /\t+/,$head,2;
my @b=split /\t+/,$a[1];
my $n=2;
foreach my $i (@b){
        next if ($n >145);   ## total number of files
        system "cut -f1,$n $in > $i.exp";
        $n++;
}

回复 6# jason680


   

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
8 [报告]
发表于 2014-03-25 15:23 |只看该作者
回复 7# 最爱在深秋

我很好奇, 你已经使用了 perl了, 为啥又调用 system 命令 使用 shell 命令来切分文件? 这样做有啥好处么?

直接把你的每一行 split 成 @row, 然后 把 $row[$i] print 到 $FILE[$i] 里不就行了?
   

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
9 [报告]
发表于 2014-03-25 23:30 |只看该作者
sorry~ {:3_188:}:
update.
  1. #!/usr/bin/perl

  2. my ( $id, @file ) = split /\s+/, <DATA>;
  3. my @cache;

  4. while (<DATA>) {
  5.     my ( $affx, @data ) = split;
  6.     for my $i ( 0 .. $#data ) {
  7.         push @{ $cache[$i] }, "$affx\t$data[$i]$/";
  8.     }
  9. }

  10. for my $i ( 0 .. $#file ) {
  11.     open my $fh, '>', "$file[$i].xls";
  12.     print $fh $id, "\t", $file[$i], $/;
  13.     print $fh @{ $cache[$i] };
  14. }

  15. __DATA__
  16. ID_REF  GSM717702       GSM717703       GSM717704       GSM717705       GSM717706
  17. AFFX-BioB-3_at  7.081480562     7.562581761     7.470186073     7.109637558     7.925162211
  18. AFFX-BioB-5_at  7.129958916     7.45944498      7.640895702     7.389891485     8.02738222
  19. AFFX-BioB-M_at  7.271660603     7.932285748     7.903917024     7.751718444     8.232053431
复制代码
output:
GSM717706.xls
  1. ID_REF        GSM717706
  2. AFFX-BioB-3_at        7.925162211
  3. AFFX-BioB-5_at        8.02738222
  4. AFFX-BioB-M_at        8.232053431
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP