免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2562 | 回复: 8
打印 上一主题 下一主题

[文本处理] 文本格式转换 excel 格式 [复制链接]

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-10-30 11:08 |只看该作者 |倒序浏览
15可用积分
本帖最后由 mswsg 于 2014-10-30 11:09 编辑

文件的分隔符 \t 格式如下
  1. address1        root        10        leaf        9        spike        10        seed        20        callus        23        cell_culture        2        mixed        24        Null        11
  2. address2        seed        20        spike        10                                                                                               
  3. address3        callus        5        root        10        seed        6        spike        6                                                               
  4. address4        spike        6                                                                                                               
复制代码
结果
  1.         root        leaf        spike        seed        callus        cell_culture        mixed        Null
  2. address1        10        9        10        20        23        2        24        11
  3. address2        0        0        10        20        0        0        0        0
  4. address3        10        0        6        6        5        0        0        0
  5. address4        0        0        6        0        0        0        0        0
复制代码
或者类似的结果也可以。
说明:结果中第一行就是域名,总共就8列 "root        leaf        spike        seed        callus        cell_culture        mixed        Null"
    address2 中没有root 就是出现0次
这个不知道大家理解吗?

最佳答案

查看完整内容

回复 1# mswsg try:

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
2 [报告]
发表于 2014-10-30 11:08 |只看该作者
回复 1# mswsg


try:
  1. awk 'BEGIN{for(i=1;i<=split("root leaf spike seed callus cell_culture mixed Null",a,/ /);i++)printf "\t"a[i];print ""}{delete b;printf $1;for(i=2;i<NF;i+=2)b[$i]=$(i+1);for(i=1;i<=8;i++)printf "\t"b[a[i]]+0;print ""}' file
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
3 [报告]
发表于 2014-10-30 11:45 |只看该作者
回复 1# mswsg
  1. gawk4.0+
  2. awk '{for(i=2;i<=NF;i+=2){a[$1][$i]=$(i+1);b[$i]}}END{for( i in b)printf "\t" i;print "";for(i in a){printf i; for(j in b)printf "\t"(a[i][j]?a[i][j]:0);print ""}}'
复制代码

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
4 [报告]
发表于 2014-10-30 15:26 |只看该作者
谢谢了回复 2# ly5066113


   

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
5 [报告]
发表于 2014-10-30 15:27 |只看该作者
十分感谢,4.0没装回复 3# yinyuemi


   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
6 [报告]
发表于 2016-04-27 00:11 |只看该作者
本帖最后由 sunzhiguolu 于 2016-04-27 00:17 编辑
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. while (<DATA>){
  5.     my ($sAddrs, @aList) = split;
  6.     my %hPairs = @aList;
  7.     foreach (qw /root leaf spike seed callus cell_culture mixed Null/){
  8.         $hPairs{$_}?($sAddrs.="\t$hPairs{$_}"):($sAddrs.="\t0");
  9.     }
  10.     print "$sAddrs\n";
  11. }

  12. __DATA__
  13. address1    root    10  leaf    9   spike   10  seed    20  callus  23  cell_culture    2   mixed   24  Null    11
  14. address2    seed    20  spike   10
  15. address3    callus  5   root    10  seed    6   spike   6
  16. address4    spike   6
复制代码

评分

参与人数 1信誉积分 +15 收起 理由
mswsg + 15 赞一个!我还是进步的,现在我也会了

查看全部评分

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
7 [报告]
发表于 2016-04-27 00:12 |只看该作者
这么老的帖子了回复 6# sunzhiguolu


   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
8 [报告]
发表于 2016-04-27 00:20 |只看该作者
回复 7# mswsg
随便翻翻, 才发现是是你啊. 赶快发分.

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP