免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4540 | 回复: 8
打印 上一主题 下一主题

hash键不唯一有什么解决方法? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-08-18 07:28 |只看该作者 |倒序浏览
本帖最后由 forward_ding 于 2011-08-18 08:16 编辑

文件1有列a、b、c,文件2有列d、e、f;
其中想以文件2的列d的数据作为键、列e作为值做一个hash,然后根据该hash处理文件1中的数据(取得文件2列e的值进行处理);
但是现在文件2的列d的数据存在重复值,怎么解决呢?

论坛徽章:
0
2 [报告]
发表于 2011-08-18 08:07 |只看该作者
回复 1# forward_ding


    不用hash,一行一行读文件2,在处理文件1

论坛徽章:
0
3 [报告]
发表于 2011-08-18 08:10 |只看该作者
本帖最后由 forward_ding 于 2011-08-18 08:17 编辑

不行的,因为数据量太大,按楼上方法效率很低,非常耗时,并且也实现不了我的需求吧?

论坛徽章:
0
4 [报告]
发表于 2011-08-18 08:13 |只看该作者
回复 3# forward_ding


    你哪个文件大?
    如果文件2大,你读的时候是一行一行读
    如果文件1大,你转换文件2为hash和读文件差不多

论坛徽章:
0
5 [报告]
发表于 2011-08-18 08:22 |只看该作者
HoA = Hash of Array

论坛徽章:
0
6 [报告]
发表于 2011-08-18 08:28 |只看该作者
本帖最后由 Perl_Er 于 2011-08-18 08:30 编辑

回复 3# forward_ding


    用hash的话,你得转换为hash,

    如果直接边读文件,边处理,少了hash转换的过程。


open(FOO, '<', 'foobar.txt') or die $!;
while (<FOO>) { # each line is stored in $_, with terminating newline
    chomp; # chomp, short for chomp($_), removes the terminating newline
    process($_); 处理文件1
}
close(FOO);

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
7 [报告]
发表于 2011-08-18 09:59 |只看该作者
不行的,因为数据量太大,按楼上方法效率很低,非常耗时,并且也实现不了我的需求吧?
forward_ding 发表于 2011-08-18 08:10



说了半天,没文档大小,没看到须求....最后没有解答

论坛徽章:
0
8 [报告]
发表于 2011-08-18 12:05 |只看该作者
HoA = Hash of Array

用这个方法解决了问题,谢谢楼上的兄弟们了。

论坛徽章:
0
9 [报告]
发表于 2011-08-18 14:27 |只看该作者
试试多维hash呢
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP