免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: shang2010
打印 上一主题 下一主题

[算法] 寡人写代码的那些事,分享一下 [复制链接]

论坛徽章:
9
程序设计版块每日发帖之星
日期:2015-10-18 06:20:00程序设计版块每日发帖之星
日期:2015-11-01 06:20:00程序设计版块每日发帖之星
日期:2015-11-02 06:20:00每日论坛发贴之星
日期:2015-11-02 06:20:00程序设计版块每日发帖之星
日期:2015-11-03 06:20:00程序设计版块每日发帖之星
日期:2015-11-04 06:20:00程序设计版块每日发帖之星
日期:2015-11-06 06:20:00数据库技术版块每周发帖之星
日期:2015-12-02 15:02:47数据库技术版块每日发帖之星
日期:2015-12-08 06:20:00
11 [报告]
发表于 2016-12-29 20:55 |只看该作者
本帖最后由 wlmqgzm 于 2016-12-29 20:57 编辑
windoze 发表于 2016-12-29 00:17
open addressing最大的问题是必须预留两个元素,一个表示未占用,另一个表示已删除。
cache友好就不要想了 ...

对的,常规的 open addressin 有 两个元素,一个表示未占用,另一个表示已删除,所以,觉得不够优化。
修改为 unsigned int  uint_distance; 其中拿出一个bit表示 未占用或者已经删除, 其余bit表示最大搜索长度,这样在数据比较满的情况下有更好的性能。
步进长度为1,所以cache友好

template<typename KEY, typename VALUE>
class  Struct_circular_hash_map_record
{
   public:
     Struct_circular_hash_map_record( void );

     #ifdef  CIRCULAR_HASH_MAP_HAS_MEMORY_COUNT
     size_t  capacity( void );
     #endif // CIRCULAR_HASH_MAP_HAS_MEMORY_COUNT

     #ifdef   CIRCULAR_HASH_MAP_VALUE_HAS_VERSION
     void     init_version( void );
     void     increase_version( void );
     unsigned int  uint_version;
     #endif // CIRCULAR_HASH_MAP_VALUE_HAS_VERSION

     unsigned int  uint_distance;
     unsigned int  uint_hash;
     KEY  key;
     VALUE  value;
};

论坛徽章:
14
水瓶座
日期:2014-06-10 09:51:0215-16赛季CBA联赛之江苏
日期:2017-11-27 11:42:3515-16赛季CBA联赛之八一
日期:2017-04-12 14:26:2815-16赛季CBA联赛之吉林
日期:2016-08-20 10:43:1215-16赛季CBA联赛之广夏
日期:2016-06-23 09:53:58程序设计版块每日发帖之星
日期:2016-02-11 06:20:00程序设计版块每日发帖之星
日期:2016-02-09 06:20:0015-16赛季CBA联赛之上海
日期:2015-12-25 16:40:3515-16赛季CBA联赛之广夏
日期:2015-12-22 09:39:36程序设计版块每日发帖之星
日期:2015-08-24 06:20:002015亚冠之德黑兰石油
日期:2015-08-07 09:57:302015年辞旧岁徽章
日期:2015-03-03 16:54:15
12 [报告]
发表于 2016-12-30 09:53 |只看该作者
wlmqgzm 发表于 2016-12-29 20:55
对的,常规的 open addressin 有 两个元素,一个表示未占用,另一个表示已删除,所以,觉得不够优化。 ...

线性探查

没有实际写过,只能搬一下《算法导论》里面的描述:容易出现群集现象

Python内部的dict结构,也是开发寻址,但不是线性探查

论坛徽章:
9
程序设计版块每日发帖之星
日期:2015-10-18 06:20:00程序设计版块每日发帖之星
日期:2015-11-01 06:20:00程序设计版块每日发帖之星
日期:2015-11-02 06:20:00每日论坛发贴之星
日期:2015-11-02 06:20:00程序设计版块每日发帖之星
日期:2015-11-03 06:20:00程序设计版块每日发帖之星
日期:2015-11-04 06:20:00程序设计版块每日发帖之星
日期:2015-11-06 06:20:00数据库技术版块每周发帖之星
日期:2015-12-02 15:02:47数据库技术版块每日发帖之星
日期:2015-12-08 06:20:00
13 [报告]
发表于 2016-12-30 12:37 |只看该作者
lxyscls 发表于 2016-12-30 09:53
线性探查

没有实际写过,只能搬一下《算法导论》里面的描述:容易出现群集现象

主要是hash计算出的数据是否足够 平均分布, 而不是挤在一起,我觉得基于intel SSE4.2指令集的 crc32c的算法,算比较优秀, 即使是85%以上的容量占用,性能也还是很好。

论坛徽章:
2
综合交流区版块每日发帖之星
日期:2016-07-06 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:00
14 [报告]
发表于 2016-12-30 13:13 |只看该作者
因为是自主的,所以是可发展的

论坛徽章:
223
2022北京冬奥会纪念版徽章
日期:2015-08-10 16:30:32操作系统版块每日发帖之星
日期:2016-05-10 19:22:58操作系统版块每日发帖之星
日期:2016-02-18 06:20:00操作系统版块每日发帖之星
日期:2016-03-01 06:20:00操作系统版块每日发帖之星
日期:2016-03-02 06:20:0015-16赛季CBA联赛之上海
日期:2019-09-20 12:29:3219周年集字徽章-周
日期:2019-10-01 20:47:4815-16赛季CBA联赛之八一
日期:2020-10-23 18:30:5320周年集字徽章-20	
日期:2020-10-28 14:14:2615-16赛季CBA联赛之广夏
日期:2023-02-25 16:26:26CU十四周年纪念徽章
日期:2023-04-13 12:23:10操作系统版块每日发帖之星
日期:2016-05-10 19:22:58
15 [报告]
发表于 2016-12-30 18:13 |只看该作者
lxyscls 发表于 2016-12-30 09:53
线性探查

没有实际写过,只能搬一下《算法导论》里面的描述:容易出现群集现象

看来大家都应该考虑使用高级语言,好多高科技在里面
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP