免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6332 | 回复: 6
打印 上一主题 下一主题

【已解决】一条记录,很多标签,按标签检索,这个怎么设计? [复制链接]

论坛徽章:
89
水瓶座
日期:2014-04-01 08:53:31天蝎座
日期:2014-04-01 08:53:53天秤座
日期:2014-04-01 08:54:02射手座
日期:2014-04-01 08:54:15子鼠
日期:2014-04-01 08:55:35辰龙
日期:2014-04-01 08:56:36未羊
日期:2014-04-01 08:56:27戌狗
日期:2014-04-01 08:56:13亥猪
日期:2014-04-01 08:56:02亥猪
日期:2014-04-08 08:38:58程序设计版块每日发帖之星
日期:2016-01-05 06:20:00程序设计版块每日发帖之星
日期:2016-01-07 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-03-30 07:57 |只看该作者 |倒序浏览
本帖最后由 chinafenghao 于 2013-04-09 12:16 编辑

比如说:

第一条记录,可能有2种标签(假定是Debian、Linux)

第二条记录,可能有4种标签(假定是Gentoo、Linux、Dev)

我想快速的检索出来所有有Linux这个标签的记录。

论坛徽章:
89
水瓶座
日期:2014-04-01 08:53:31天蝎座
日期:2014-04-01 08:53:53天秤座
日期:2014-04-01 08:54:02射手座
日期:2014-04-01 08:54:15子鼠
日期:2014-04-01 08:55:35辰龙
日期:2014-04-01 08:56:36未羊
日期:2014-04-01 08:56:27戌狗
日期:2014-04-01 08:56:13亥猪
日期:2014-04-01 08:56:02亥猪
日期:2014-04-08 08:38:58程序设计版块每日发帖之星
日期:2016-01-05 06:20:00程序设计版块每日发帖之星
日期:2016-01-07 06:20:00
2 [报告]
发表于 2013-03-30 09:59 |只看该作者
我现在想到的是每一个标签都检索一次,然后取一个交集。

不知道有没有更好的方法。

论坛徽章:
9
每日论坛发贴之星
日期:2016-01-04 06:20:00数据库技术版块每日发帖之星
日期:2016-01-04 06:20:00每日论坛发贴之星
日期:2016-01-04 06:20:00数据库技术版块每日发帖之星
日期:2016-01-04 06:20:00IT运维版块每日发帖之星
日期:2016-01-04 06:20:00IT运维版块每日发帖之星
日期:2016-01-04 06:20:00综合交流区版块每日发帖之星
日期:2016-01-04 06:20:00综合交流区版块每日发帖之星
日期:2016-01-04 06:20:00数据库技术版块每周发帖之星
日期:2016-03-07 16:30:25
3 [报告]
发表于 2013-04-01 10:11 |只看该作者
按照范式来说,一张记录表,一张标签表,一张记录ID和标签ID的关联表是最佳设计,性能也好。

select * from 记录表 join 标签表 join 关联表 where 标签表.name = ‘linux’;

论坛徽章:
89
水瓶座
日期:2014-04-01 08:53:31天蝎座
日期:2014-04-01 08:53:53天秤座
日期:2014-04-01 08:54:02射手座
日期:2014-04-01 08:54:15子鼠
日期:2014-04-01 08:55:35辰龙
日期:2014-04-01 08:56:36未羊
日期:2014-04-01 08:56:27戌狗
日期:2014-04-01 08:56:13亥猪
日期:2014-04-01 08:56:02亥猪
日期:2014-04-08 08:38:58程序设计版块每日发帖之星
日期:2016-01-05 06:20:00程序设计版块每日发帖之星
日期:2016-01-07 06:20:00
4 [报告]
发表于 2013-04-01 10:34 |只看该作者
cenalulu 发表于 2013-04-01 10:11
按照范式来说,一张记录表,一张标签表,一张记录ID和标签ID的关联表是最佳设计,性能也好。

select * f ...


我也是这么考虑的,但是如果需要检索包含2个标签的记录,似乎就没法一次性搞定了。

所以我打算先select出来包含第一个标签的所有记录的主键,然后在select出来包含另外的一个标签的所有记录的主键,然后对两个次的结果取交集。

交集的算法我自己用PHP搞定,由于两次的结果都是整数集合,所以交集算法的速度应该还是可以接受的。

论坛徽章:
9
每日论坛发贴之星
日期:2016-01-04 06:20:00数据库技术版块每日发帖之星
日期:2016-01-04 06:20:00每日论坛发贴之星
日期:2016-01-04 06:20:00数据库技术版块每日发帖之星
日期:2016-01-04 06:20:00IT运维版块每日发帖之星
日期:2016-01-04 06:20:00IT运维版块每日发帖之星
日期:2016-01-04 06:20:00综合交流区版块每日发帖之星
日期:2016-01-04 06:20:00综合交流区版块每日发帖之星
日期:2016-01-04 06:20:00数据库技术版块每周发帖之星
日期:2016-03-07 16:30:25
5 [报告]
发表于 2013-04-01 11:09 |只看该作者
select 记录id from 关联表 where tag in ( 'tag1','tag2') group by 记录id having count(*) =2 ;
这样也可以

论坛徽章:
0
6 [报告]
发表于 2013-04-01 17:16 |只看该作者
1) mysql select .. from a inner join b where a.xx=b.xx;
2) oracle/sql server select .. from a intersect select .. from b;
3) c++  使用map容器(rbtree),小数据hash也可以
4) 大数据,允许一定量误差的可以考虑bloom filter

论坛徽章:
0
7 [报告]
发表于 2013-04-01 17:23 |只看该作者
今天正好几个朋友聊起这个事。给看的例子类似于: http://www.zol.com/cell_phone/list/c34_s57.html
可以考虑研究一下这个,加url rewrite 中间生成的搜索结果可以考虑用redis存起来。其实处理着也不难。

另外还可以solr这类东西
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP