免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 6249 | 回复: 20
打印 上一主题 下一主题

unix多进程使用shell sort排序文件的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-01-09 21:30 |只看该作者 |倒序浏览
unix下写c程序,排序文件
首先测试:
a.txt文件200多万行数据
使用sort -T /aaa -k 2 a.txt >; b.txt排序
执行11分钟

然后再测试900多个文件共1.8亿行数据,分十个进程对这些900多文件进行sort排序
结果竟然用了9个小时

按平均来说1.8亿/10/9=200万
也就是说一个进程一个小时才排一个200万行的文件
这不可能呀

什么原因呢?
难道说十个进程并不是并行的排序?
该如何提高速度???

谢谢

论坛徽章:
62
2016科比退役纪念章
日期:2016-06-28 17:45:06奥兰多魔术
日期:2015-05-04 22:47:40菠菜神灯
日期:2015-05-04 22:35:07菠菜神灯
日期:2015-05-04 22:35:02NBA季后赛大富翁
日期:2015-05-04 22:33:34NBA常规赛纪念章
日期:2015-05-04 22:32:032015年亚洲杯纪念徽章
日期:2015-04-14 16:54:452015年亚洲杯之朝鲜
日期:2015-03-19 23:03:16明尼苏达森林狼
日期:2015-03-16 21:51:152015小元宵徽章
日期:2015-03-06 15:57:202015年迎新春徽章
日期:2015-03-04 09:55:282015年辞旧岁徽章
日期:2015-03-03 16:54:15
2 [报告]
发表于 2005-01-09 21:37 |只看该作者

unix多进程使用shell sort排序文件的问题

原帖由 "cnufo" 发表:
unix下写c程序,排序文件
首先测试:
a.txt文件200多万行数据
使用sort -T /aaa -k 2 a.txt >; b.txt排序
执行11分钟

然后再测试900多个文件共1.8亿行数据,分十个进程对这些900多文件进行sort排序
结果竟..........


900多个文件统一排序??
那当然不是一个文件的累计,排序随着元素的增加几何增长

论坛徽章:
0
3 [报告]
发表于 2005-01-09 21:47 |只看该作者

unix多进程使用shell sort排序文件的问题

不是900多个文件统一排序
是对900多个文件单个排序
比如900多个文件:A,B,C,D,E,F,G,H,I,J,K,L……
开十个进程
第一个进程排序:A,B……排完A,排B
第二个进程排序:C,D……排完C,排D
……
第十个进程排序:……

论坛徽章:
62
2016科比退役纪念章
日期:2016-06-28 17:45:06奥兰多魔术
日期:2015-05-04 22:47:40菠菜神灯
日期:2015-05-04 22:35:07菠菜神灯
日期:2015-05-04 22:35:02NBA季后赛大富翁
日期:2015-05-04 22:33:34NBA常规赛纪念章
日期:2015-05-04 22:32:032015年亚洲杯纪念徽章
日期:2015-04-14 16:54:452015年亚洲杯之朝鲜
日期:2015-03-19 23:03:16明尼苏达森林狼
日期:2015-03-16 21:51:152015小元宵徽章
日期:2015-03-06 15:57:202015年迎新春徽章
日期:2015-03-04 09:55:282015年辞旧岁徽章
日期:2015-03-03 16:54:15
4 [报告]
发表于 2005-01-09 21:52 |只看该作者

unix多进程使用shell sort排序文件的问题

原帖由 "cnufo" 发表:
不是900多个文件统一排序
是对900多个文件单个排序
比如900多个文件:A,B,C,D,E,F,G,H,I,J,K,L……
开十个进程
第一个进程排序:A,B……排完A,排B
第二个进程排序:C,D……排完C,排D
……
第十个进程排序:…..........


排序是很耗内存和cpu的,几百万行的文件也得几十兆了。
同时10个大循环操作一般机器还真受不了,不如试试就1,2个进程。
拍一个写个日志,先试10个文件,应该会更快

论坛徽章:
0
5 [报告]
发表于 2005-01-09 21:55 |只看该作者

unix多进程使用shell sort排序文件的问题

你的意思是开5个进程一起排序比开10个排序这900多个文件快?

论坛徽章:
62
2016科比退役纪念章
日期:2016-06-28 17:45:06奥兰多魔术
日期:2015-05-04 22:47:40菠菜神灯
日期:2015-05-04 22:35:07菠菜神灯
日期:2015-05-04 22:35:02NBA季后赛大富翁
日期:2015-05-04 22:33:34NBA常规赛纪念章
日期:2015-05-04 22:32:032015年亚洲杯纪念徽章
日期:2015-04-14 16:54:452015年亚洲杯之朝鲜
日期:2015-03-19 23:03:16明尼苏达森林狼
日期:2015-03-16 21:51:152015小元宵徽章
日期:2015-03-06 15:57:202015年迎新春徽章
日期:2015-03-04 09:55:282015年辞旧岁徽章
日期:2015-03-03 16:54:15
6 [报告]
发表于 2005-01-09 21:59 |只看该作者

unix多进程使用shell sort排序文件的问题

[quote]原帖由 "cnufo"]你的意思是开5个进程一起排序比开10个排序这900多个文件快?[/quote 发表:


看你什么机器了。10个进程是多了点
而且sort命令还包括大量的i/o操作
你可以试试一个一个进程的开看看cpu和内存的使用量,看是什么时候cpu到100%

论坛徽章:
0
7 [报告]
发表于 2005-01-09 22:05 |只看该作者

unix多进程使用shell sort排序文件的问题

一共12个CPU
hp

论坛徽章:
0
8 [报告]
发表于 2005-01-09 22:17 |只看该作者

unix多进程使用shell sort排序文件的问题

原帖由 "cnufo" 发表:
一共12个CPU
hp
要在过程中不断调整并监控,才能知道瓶颈。
我觉得瓶颈可能在IO上

论坛徽章:
0
9 [报告]
发表于 2005-01-09 22:32 |只看该作者

unix多进程使用shell sort排序文件的问题

请问楼上,该如何调整、监控?
请详细些
谢谢

另外,如果在IO上应该怎么解决?

论坛徽章:
62
2016科比退役纪念章
日期:2016-06-28 17:45:06奥兰多魔术
日期:2015-05-04 22:47:40菠菜神灯
日期:2015-05-04 22:35:07菠菜神灯
日期:2015-05-04 22:35:02NBA季后赛大富翁
日期:2015-05-04 22:33:34NBA常规赛纪念章
日期:2015-05-04 22:32:032015年亚洲杯纪念徽章
日期:2015-04-14 16:54:452015年亚洲杯之朝鲜
日期:2015-03-19 23:03:16明尼苏达森林狼
日期:2015-03-16 21:51:152015小元宵徽章
日期:2015-03-06 15:57:202015年迎新春徽章
日期:2015-03-04 09:55:282015年辞旧岁徽章
日期:2015-03-03 16:54:15
10 [报告]
发表于 2005-01-09 22:49 |只看该作者

unix多进程使用shell sort排序文件的问题

原帖由 "cnufo" 发表:
请问楼上,该如何调整、监控?
请详细些
谢谢

另外,如果在IO上应该怎么解决?


你一个进程一个进程的开,不就是了。
什么时候cpu到了高水平就是出问题了。也看看是不是每个cpu都用上了
用sort命令没法调整io
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP