免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6964 | 回复: 17
打印 上一主题 下一主题

[文本处理] awk如何将一个矩阵中正数变成1,负数变成-1,0还是0 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-03-06 19:17 |只看该作者 |倒序浏览
本帖最后由 chenjiali1 于 2015-03-06 20:28 编辑

gene_id-exonA_num       YTHDC1.1        YTHDC1.2        SRSF1
ENSG00000110719-5       -10.2077283895466       1.4918414918415 -2.4503115637264
ENSG00000115760-14      24.9427917620137        13.047068538398 -26.0219962647852
ENSG00000151116-2       15.4278305963699        9.2447731474897 6.2200956937799
ENSG00000132952-4       6.25    -10.4636591478697       3.50877192982456
ENSG00000240771-9       -7.95454545454545       -13.3333333333333       4.8780487804878
ENSG00000148773-9       -4.36729396495782       -13.8505181827253       -11.5785311851339
ENSG00000071889-4       -6.03838976272995       0       4.07185628742515
ENSG00000075711-7       -13.508064516129        -9.85691573926869       0.555555555555557
ENSG00000154222-10      8.89245585874799        -10.5985453984734       0
想把正的变成1,负的变成-1,第一列照常输出,请问如何实现,谢谢大家!

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2015-03-06 19:43 |只看该作者
本帖最后由 jason680 于 2015-03-06 19:47 编辑

回复 1# chenjiali1

  1. $ awk 'function p(x){return(sprintf("%3s%10s",x>0?1:-1,""))}NR>1{s=sprintf("%-20s",$1);for(n=2;n<=NF;n++)s=s"   "p($n);$0=s}1' FILE
  2. gene_id-exonA_num       YTHDC1.1        YTHDC1.2        SRSF1
  3. ENSG00000110719-5       -1               1              -1         
  4. ENSG00000115760-14       1               1              -1         
  5. ENSG00000151116-2        1               1               1         
  6. ENSG00000132952-4        1              -1               1         
  7. ENSG00000240771-9       -1              -1               1         
  8. ENSG00000148773-9       -1              -1              -1         
  9. ENSG00000071889-4       -1              -1               1         
  10. ENSG00000075711-7       -1              -1               1         
  11. ENSG00000154222-10       1              -1              -1     
复制代码

   

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
3 [报告]
发表于 2015-03-06 19:45 |只看该作者
  1. awk 'BEGIN{getline;print}{for(i=2;i<=NF;i++)$i=$i>1?1:-1}1' file|column -t
  2. gene_id-exonA_num   YTHDC1.1  YTHDC1.2  SRSF1
  3. ENSG00000110719-5   -1        1         -1
  4. ENSG00000115760-14  1         1         -1
  5. ENSG00000151116-2   1         1         1
  6. ENSG00000132952-4   1         -1        1
  7. ENSG00000240771-9   -1        -1        1
  8. ENSG00000148773-9   -1        -1        -1
  9. ENSG00000071889-4   -1        -1        1
  10. ENSG00000075711-7   -1        -1        -1
  11. ENSG00000154222-10  1         -1        -1
复制代码

论坛徽章:
0
4 [报告]
发表于 2015-03-06 20:02 |只看该作者
回复 3# 聆雨淋夜

这种方法很好理解啊。

   

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
5 [报告]
发表于 2015-03-06 20:03 |只看该作者
回复 4# ppjer
因为我很笨,难了也想不出来

   

论坛徽章:
0
6 [报告]
发表于 2015-03-06 20:22 |只看该作者
回复 3# 聆雨淋夜


    那请问如果有0,想保证不变呢。0还是0

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
7 [报告]
发表于 2015-03-06 20:31 |只看该作者
回复 6# chenjiali1
  1. awk 'BEGIN{getline;print}{for(i=2;i<=NF;i++){if($i>0)$i=1;else if($i<0)$i=-1}}1' file|column -t
复制代码

论坛徽章:
28
2015年迎新春徽章
日期:2015-03-04 10:16:53午马
日期:2015-03-20 17:11:07亥猪
日期:2015-03-20 17:11:23戌狗
日期:2015-03-20 17:11:33酉鸡
日期:2015-03-20 17:11:47申猴
日期:2015-03-20 17:11:58未羊
日期:2015-03-20 17:12:10子鼠
日期:2015-03-20 17:12:23丑牛
日期:2015-03-20 17:12:40卯兔
日期:2015-03-20 17:12:51辰龙
日期:2015-03-20 17:13:00巳蛇
日期:2015-03-20 17:13:12
8 [报告]
发表于 2015-03-06 22:23 |只看该作者
本帖最后由 我是一隻羊 于 2015-03-06 22:30 编辑

现学现卖..
  1. awk 'function c(e){return e==0?"0":e>0?"1":e<0?"-1"}NR>1{s=sprintf("%-30s",$1);for(i=1;i++<NF;)s=s""sprintf("%-13s",c($i));$0=s}1' inputfile
复制代码

论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
9 [报告]
发表于 2015-03-06 22:55 |只看该作者
  1. awk 'NR>1{for(i=1;i++<NF;)$i=$i==0?0:gensub(/[^-]+.*$/,"1", "g", $i)}1' a
  2. ene_id-exonA_num       YTHDC1.1        YTHDC1.2        SRSF1
  3. ENSG00000110719-5 -1 1 -1
  4. ENSG00000115760-14 1 1 -1
  5. ENSG00000151116-2 1 1 1
  6. ENSG00000132952-4 1 -1 1
  7. ENSG00000240771-9 -1 -1 1
  8. ENSG00000148773-9 -1 -1 -1
  9. ENSG00000071889-4 -1 0 1
  10. ENSG00000075711-7 -1 -1 1
  11. ENSG00000154222-10 1 -1 0
复制代码

论坛徽章:
0
10 [报告]
发表于 2015-03-06 23:21 |只看该作者
回复 7# 聆雨淋夜


BEGIN{getline;print}  开头这是什么意思,启到什么作用
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP