免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4814 | 回复: 5
打印 上一主题 下一主题

[文本处理] 求助:sort复杂排序,请问问题在哪? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-09-05 12:34 |只看该作者 |倒序浏览
数据较多,截取这里显示的部分,请见附件。
要求是:数据排序是先按第一列排,即第一列相同的连续出现,再按第二列和第三列的数值大小排。

倒数第五行应该排第一的,请问各位应该怎么改呢?谢谢!

ATXN10  114     121     7.89520192866   -       BRCA1   GCAACAG

$ sort -k1 -k2.1,2n -k3.1,3n dat.tab
ATXN10  1006    1018    12.7106839874   +       Foxd3   TTATGTTTGCTT
ATXN10  1027    1034    7.26135805254   +       Nkx2-5  TCAATAG
ATXN10  1042    1048    6.29590920889   +       ETS1    GTTCCT
ATXN10  1046    1056    9.57798823809   -       ELK1    AAACCTGAAG
ATXN10  1054    1060    7.63614292983   +       NFIC    TTGGAA
ATXN10  1060    1066    8.93282676783   -       GATA3   AGATAG
ATXN10  1061    1066    6.64622021607   -       GATA2   AGATA
ATXN10  1069    1075    8.98098841331   -       ARID3A  ATTAAT
ATXN10  1069    1075    8.98098841331   +       ARID3A  ATTAAT
ATXN10  1071    1077    6.61656137673   -       GATA3   AGATTA
ATXN10  1080    1085    5.91874607088   -       GATA2   AGATG
ATXN10  1089    1095    9.27828899252   +       ZEB1    CACCTA
ATXN10  1095    1104    8.87584182903   -       TFAP2A  GCCCTGCGC
ATXN10  1108    1115    10.9076341875   +       Sox5    CAACAAT
ATXN10  1115    1121    7.17705535099   +       SOX10   TTTTGT
ATXN10  1121    1129    7.30099664315   +       FOXC1   TGAAAGTA
ATXN10  1127    1135    6.90688896429   -       FOXL1   TGTATATA
ATXN10  1131    1139    6.41442407839   -       FOXC1   ACAGTGTA
ATXN10  1132    1138    7.40918267276   -       SOX10   CAGTGT
ATXN10  1132    1140    6.10956949686   +       FOXC1   ACACTGTA
ATXN10  114     121     7.89520192866   -       BRCA1   GCAACAG
ATXN10  1151    1157    6.69239426588   -       ETS1    TTTCCA
BTXN10  1159    1169    7.04581991459   -       Hltf    TCACATATTT
CTXN10  1160    1168    7.71013494011   -       HOXA5   CACATATT
ETXN10  1170    1176    7.32603410506   -       GATA3   TGATAA




dat.zip (662 Bytes, 下载次数: 2)



论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
2 [报告]
发表于 2013-09-05 12:57 |只看该作者
  1. sort -nk1 -nk2 -nk3 urfile
复制代码

论坛徽章:
10
天蝎座
日期:2013-09-22 22:32:23程序设计版块每日发帖之星
日期:2016-08-07 06:20:00lufei
日期:2016-06-17 17:38:40程序设计版块每日发帖之星
日期:2016-06-12 06:20:002016科比退役纪念章
日期:2016-05-31 15:47:20CU十四周年纪念徽章
日期:2016-05-27 12:24:562015年亚洲杯之阿曼
日期:2015-05-03 21:01:352015年辞旧岁徽章
日期:2015-03-03 16:54:15天蝎座
日期:2013-10-20 21:05:24程序设计版块每日发帖之星
日期:2016-08-11 06:20:00
3 [报告]
发表于 2013-09-05 13:05 |只看该作者

  1. sort -k1,1 -k2n,3n
复制代码

论坛徽章:
0
4 [报告]
发表于 2013-09-05 14:52 |只看该作者
回复 2# 关阴月飞

谢谢哦,这个针对这个数据是可以的,但针对整个大数据却行不通的。
   

论坛徽章:
0
5 [报告]
发表于 2013-09-05 14:54 |只看该作者
回复 3# liion631818

非常感谢,我运行试了试,可以了。

论坛徽章:
1
射手座
日期:2014-03-10 14:24:52
6 [报告]
发表于 2013-09-05 16:00 |只看该作者
各种高手啊!学习!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP