免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2824 | 回复: 4
打印 上一主题 下一主题

python 读CSV文件求救 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-09-22 10:47 |只看该作者 |倒序浏览
本人刚学习python,现想实现一个功能,望高手们赐教
      有两个不同内容的csv文件,但是两个文件中可能会有相同的记录数据,怎样实现一个最快占资源最少的方法使得能够提取出相同的数据。
因为数据量很大,如果单用循环遍历会很占时间空间,望高手们提供一个好的方案,谢谢!

论坛徽章:
0
2 [报告]
发表于 2008-09-22 12:13 |只看该作者
这个可以看成一个算法题了,已经不局限在python版了
我对CSV不太了解,不知道里面的数据是什么样的,如果是有序的话,可以采用二路归并,
时间复杂度是O(m+n),m,n是两个CSV文件的长度

论坛徽章:
0
3 [报告]
发表于 2008-09-27 15:21 |只看该作者

回复 #2 hmilyln 的帖子

也没有什么好的办法,就是把一个csv文件的数据放进一个字典里面,在对另一个csv文件进行遍历,用字典的has_key方法去判断了,速度还能接受

论坛徽章:
0
4 [报告]
发表于 2008-09-27 17:17 |只看该作者
牺牲空间,节约时间
牺牲时间,节约空间

鱼和熊掌不可兼得吧

论坛徽章:
0
5 [报告]
发表于 2008-09-27 20:44 |只看该作者
应该是没什么取巧的办法。就是遍历,比较。

楼主可以考虑实现__hash__, __eq__, __ne__, 甚至__lt__, __gt__。在Python下,这样做可以改善某些性能。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP