ChinaUnix.net
相关文章推荐:

面试 跨文件排序

请用SHELL完成下列排序: 有一个文件,每行记录了字符串(长度为1-127字节),大约有1亿行,请排出重复次数最高的前1000条。(可以用awk、sed等工具)。 比如问如下: aaa ccc ccc ddd aaa aaa bbb 那么重复次数为: aaa 3次 ccc 2次 ddd 1次 bbb 1次 当然不局限于shell,这只是一个工具而已,关键在与排序算法 欢迎各位不吝赐教~~~ PS:请尽量考虑效率问题。因为数据量实在是太大了。。。。

by diligent4pig - Shell - 2009-05-05 12:13:56 阅读(17175) 回复(38)

相关讨论

有一亿个正整数,请输出重复最多的100个数,不知怎么解! 在这些数中是部份有序的 再补充一个,如果有重复次数相同的数 则按数的大小排 [ 本帖最后由 phpos 于 2008-4-23 09:23 编辑 ]

by phpos - C/C++ - 2008-04-23 10:02:27 阅读(1486) 回复(4)

一txt文件,里面的记录如下,现在想根据第一列时间来排序成 [code]2009-06-24,0000002001,0802,1201,1452,1800[/code] 请各位CU兄弟帮忙,谢谢。 [code]2009-06-24 00:00:00,0802,0000002001,0 2009-06-24 00:00:00,1201,0000002001,0 2009-06-24 00:00:00,1452,0000002001,0 2009-06-24 00:00:00,1755,0000002001,0 2009-06-24 00:00:00,1800,0000002001,0 2009-06-25 00:00:00,0741,0000002001,0 2009-06-25 00:00:00,120...

by dingjeff - Python - 2009-07-17 21:29:14 阅读(6248) 回复(13)

文件内容如下: 01wang zhang f/s 02wang li f/d 03wang li f/s 04wang zhang f/s2 05song liu f/s 06wang zhang f/s3 07song zhang f/s2 08wang zhang f/m 以第三个字符到第十四个字符为key排序, 希望得到如何排序结果: 01wang zhang f/s 04wang zhang f/s2 06wang zhang f/s3 08wang zhang f/m 02wang li f/d 03wang li f/s 05song ...

by reason001 - Shell - 2008-02-20 08:52:50 阅读(2790) 回复(17)

现有文件格式如下: [quote] ...... *****,20060920,010115,****,******, *****,20060920,010111,****,******, *****,20060920,010112,****,******, ...... [/quote] 每行记录都以逗号符分隔,第二列和第三列分别表示日期和时间且无序显示,现想将其按时间升序排列,有什么好的方法吗?

by nbaloverme - Shell - 2006-09-20 16:18:22 阅读(3639) 回复(6)

我自己写了个脚本,定期执行并产生一个文件,每天都产生一个文件文件名都是以文件生成的时间来命名的,时间格式是20060417这个样子的(表示是2006年4月17号生成的文件),有什么方法可以将这些文件按日期的先后顺序罗列出来? 谢谢赐教!

by xxjoyjn - 系统管理 - 2006-04-17 17:20:03 阅读(692) 回复(2)

02 1111111111111111111 赵AAA 700C P5F6 2005-08-11 00048 1200000.00 02 2134567890000000000 许BBB 700C P5F6 2005-08-11 00005 209932.00 02 2345678901234567890 赵CCC 700E P542 2005-08-11 00102 400000.00 02 2098765432107777777 王DDD 700C P51B 2005-08-11 00039 73191...

by lenovo666 - Shell - 2005-08-16 13:32:29 阅读(1112) 回复(5)

需要用perl对比较大的文本文件(50M以上)按行排序,全部读入内存操作似乎不太合适,请教一个比较好的方法。thanks

by redspider - Perl - 2005-02-06 13:56:41 阅读(6026) 回复(29)

各位大虾:小弟有一事相求!! 怎样对文件内的记录进行排序?? 要求:1、文件内的记录中各个字段没有特定的(分隔)符号; 2、要求其中某一个或几个(有可能不连续)的字段作为SortKey; 3、排序完后不必要重新生成新的文件

by 疯狂贝勒 - HP-UX - 2004-04-08 15:58:54 阅读(829) 回复(3)

我用的是在XP下的虚拟机装的linux,映像文件在E盘,我在LINUX 可以访问XP的文件吗?比如D盘的电影。谢谢

by 蓝色的忧郁 - Linux论坛 - 2003-10-18 23:04:48 阅读(724) 回复(9)

手头经常需要对一些文本文件进行行排序(每个文本文件大概10G左右),使用EDITPLUS,UEDIT不是打不开就是速度很慢,想自己写个PYTHON程序处理,请教各位有没有好的解决办法? python中有没有相关的处理模块?谢谢!

by moatlzy - Python - 2009-03-24 12:40:39 阅读(2598) 回复(4)