免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 7666 | 回复: 6
打印 上一主题 下一主题

[文本处理] 如何按照最后一列数字大小进行排序? [复制链接]

论坛徽章:
1
白羊座
日期:2014-11-13 10:19:16
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-08-03 12:38 |只看该作者 |倒序浏览
如何按照最后一列数量进行排序?
文本由两部分组成,前面为数量不定的单词,最后一列为金额(每三位以逗号隔开)
金额与单词间是TAB字符
  1. With The First Rectangle        194,000,000
  2. So Next Continue        293,000,000
  3. Future Sheet Of Paper        6,580,000
  4. Aboard This Process 2010        400,000
  5. 80 S Time Retract The Foot        12,400,000
  6. Cardstock Via This Process        87,400,000
  7. Moreover Stick Along With        15,000,000
  8. Granted Corp        66,200,000
  9. Sensors Have A Fixed        1,186,000,000
  10. Reliable Circumstances Substitute        359,000,000
  11. All Certainly        0
  12. Of These Using Good A        1,143,000,000
  13. Period Of Point        40,600,000
  14. Inthat Would 5 Long Periods        219,000,000
  15. Of Time More Than The Kind Alarm        12,400,000
  16. The Actual Current Email        695,400,000
  17. Address Contact Information Are        47,500,000
  18. Not Authored Virtual Farmland        82,000
  19. Prepared Among Asteric Need        560
  20. Loads Of Ways To Do The Best        465,000
  21. With The First Rect angle        178,000,000
复制代码

论坛徽章:
3
天蝎座
日期:2013-12-10 19:37:11酉鸡
日期:2014-08-04 20:05:38双鱼座
日期:2014-08-09 21:53:54
2 [报告]
发表于 2014-08-03 13:23 |只看该作者
本帖最后由 欧阳西风 于 2014-08-03 13:27 编辑

回复 1# iocg


    排序完以后还要保持数字之间以,分隔吗?我写了一个比较长的命令,希望有人能够写个更好一点儿的
  1. sed 'h;s/.*\(\t.*\)/\1/;s/,//g;H;g;s/\n//' sort_by_last_number.txt  | sort -n -t $'\t' -k 3 |  sed 's/\(.*\t.*\)\t.*/\1/'
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
3 [报告]
发表于 2014-08-03 15:17 |只看该作者
awk 'BEGIN{cmd="sort -nr -k1,1";}{print gensub(/,/,"","g",$NF),$0|& cmd;}END{ close(cmd,"to");while(cmd|& getline){print gensub($1 FS,"",1)} ;close(cmd)}'

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
4 [报告]
发表于 2014-08-03 18:57 |只看该作者
这种问题,用excel做最方便了~

论坛徽章:
1
白羊座
日期:2014-11-13 10:19:16
5 [报告]
发表于 2014-08-03 19:30 |只看该作者
本帖最后由 iocg 于 2014-08-03 19:44 编辑

回复 4# yestreenstars


    少量的数据可以用Excel解决,不过我用2003最大只能支持65535行。
  1. sed 's/\,//g' 1.txt | sort -t'        ' -n -k2
复制代码
我现在用这种办法,不过如果能将30000000转为30,000,000形式就更好了。

    谢谢2楼和3楼,问题已解决啦~~

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
6 [报告]
发表于 2014-08-04 09:41 |只看该作者
回复 1# iocg

$ awk '{k=$NF;gsub(",","",k);a[sprintf("%020d",k)]=$0}END{t=asorti(a,b);for(n=1;n<=t;n++)print a[b[n]]}' FILE
All Certainly        0
Prepared Among Asteric Need        560
Not Authored Virtual Farmland        82,000
Aboard This Process 2010        400,000
Loads Of Ways To Do The Best        465,000
Future Sheet Of Paper        6,580,000
Of Time More Than The Kind Alarm        12,400,000
Moreover Stick Along With        15,000,000
Period Of Point        40,600,000
Address Contact Information Are        47,500,000
Granted Corp        66,200,000
Cardstock Via This Process        87,400,000
With The First Rect angle        178,000,000
With The First Rectangle        194,000,000
Inthat Would 5 Long Periods        219,000,000
So Next Continue        293,000,000
Reliable Circumstances Substitute        359,000,000
The Actual Current Email        695,400,000
Of These Using Good A        1,143,000,000
Sensors Have A Fixed        1,186,000,000

   

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
7 [报告]
发表于 2014-08-04 10:31 |只看该作者
sed -e 's/   */#/g' file | sort -t '#' -nk3 | sed -e 's/#/    /g'
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP