免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2382 | 回复: 2
打印 上一主题 下一主题

[文本处理] awk文本提取与转换 [复制链接]

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-11-29 17:57 |只看该作者 |倒序浏览
5可用积分
本帖最后由 mswsg 于 2014-11-29 17:58 编辑

文件a.txt
  1. 第一列        第二列
  2. SNP1        0
  3. SNP2        10.778
  4. SNP3        10.778
  5. SNP4        10.778
  6. SNP5        50.668
  7. SNP6        51.778
  8. SNP7        60.888
  9. SNP8        60.888
  10. SNP9        60.888
  11. SNP10        60.888
  12. SNP11        60.888
  13. SNP12        100.002
  14. SNP13        100.002
  15. SNP14        100.002
  16. SNP15        111.2
复制代码
文件b.txt
  1. 第一列        第二列        第三列
  2. SNP1        0        0.5
  3. SNP2        10.778        0.5
  4. SNP5        50.668        2
  5. SNP6        51.778        2.5
  6. SNP9        60.888        3
复制代码
根据文件b中第二列的信息,如果和第二列的数字相同,相同则在下一行打印出
结果文件
  1. 第一列        第二列        第三列
  2. SNP1        0        0.5
  3. SNP2        10.778        0.5
  4. SNP3        10.778        0
  5. SNP4        10.778        0
  6. SNP5        50.668        2
  7. SNP6        51.778        2.5
  8. SNP9        60.888        3
  9. SNP7        60.888        0
  10. SNP8        60.888        0
  11. SNP10        60.888        0
  12. SNP11        60.888        0
复制代码

最佳答案

查看完整内容

回复 1# mswsg $ awk -vOFS="\t" 'FNR==NR{a[$1,$2]=$3;e[$2]=1;next}{if(e[$2])print $0,(a[$1,$2])?a[$1,$2]:0}' b.txt a.txt第一列 第二列 第三列SNP1 0 0.5SNP2 10.778 0.5SNP3 10.778 0SNP4 10.778 0SNP5 50.668 2SNP6 51.778 2.5SNP7 60.888 0SNP8 60.888 0SNP9 60.888 3SNP10 60.888 0SNP11 60.888 0

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2014-11-29 17:57 |只看该作者
回复 1# mswsg

$ awk -vOFS="\t" 'FNR==NR{a[$1,$2]=$3;e[$2]=1;next}{if(e[$2])print $0,(a[$1,$2])?a[$1,$2]:0}' b.txt  a.txt
第一列        第二列        第三列
SNP1        0        0.5
SNP2        10.778        0.5
SNP3        10.778        0
SNP4        10.778        0
SNP5        50.668        2
SNP6        51.778        2.5
SNP7        60.888        0
SNP8        60.888        0
SNP9        60.888        3
SNP10        60.888        0
SNP11        60.888        0


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP