免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4581 | 回复: 13

[网络] 2013校园招聘腾讯附加题 [复制链接]

论坛徽章:
0
发表于 2012-09-24 00:18 |显示全部楼层
题目记得不大清楚了,只好描述下大致意思

1、腾讯做广告是盈利的一部分,腾讯微博信息中可以分为很多关键字段,而广告需要最热的关键字做广告。每个月关键字的统计量1T,从中选择最热的十个关键字。。

2、腾讯新闻有一篇文章,统计其访问次数,web服务器将来自不同的Ip进行解析,设计一个后台系统来统计Ip访问量。


请有相关经验的人指点迷津,或是提供点资料,非常感谢!

论坛徽章:
0
发表于 2012-09-24 08:44 |显示全部楼层
本帖最后由 _Rayx 于 2012-09-24 08:46 编辑

个人见解:
1.先用关键字做hash,分解成一个一个小文件,如果存在还在比较大的文件,将那个大文件再用另一个hash函数做一次hash.再统计每个小文件的前10,再做一个堆,保证将每个前10加入堆中,并保证堆的元素个数不超过10个即可。

2.第二个暂时只想到一个挫办法,就是将IP做为整数,以二叉排序树存储。不过应该有更好的方法。
或者存在数据库里,然后以IP整数为序做索引,交给数据库去管理。

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
发表于 2012-09-24 11:32 |显示全部楼层
本帖最后由 linux_c_py_php 于 2012-09-24 11:39 编辑

1, map reduce 定时的归并, 如果是做实时推荐系统, 可以参考下面的方法, 在MQ另一端异步的统计, 不需要影响线上服务质量(QOS). 其实还有几个开源实时系统, 做数据挖掘的同学可能比较清楚, 只知道同事有在研究这方面的东西.
2, php接到request, 取$SERVER['HTTP_CLIENT_IP']丢到RabbitMQ, 写个C消费者在后台慢慢的统计, 在C消费者后面挂一个DB即可.

hubimaso 发表于 2012-09-24 00:18
题目记得不大清楚了,只好描述下大致意思

1、腾讯做广告是盈利的一部分,腾讯微博信息中可以分为很多关键 ...

论坛徽章:
125
处女座
日期:2014-06-14 02:20:38双子座
日期:2014-06-14 03:59:12处女座
日期:2014-06-14 04:14:31狮子座
日期:2014-06-14 05:24:38巳蛇
日期:2014-06-14 05:48:58巨蟹座
日期:2014-06-14 05:50:18摩羯座
日期:2014-06-14 06:23:58双鱼座
日期:2014-06-14 06:49:15亥猪
日期:2014-06-14 07:04:56巨蟹座
日期:2014-06-14 07:12:32双子座
日期:2014-06-14 07:26:53射手座
日期:2014-06-14 07:58:51
发表于 2012-09-24 14:24 |显示全部楼层
不会           学习

论坛徽章:
0
发表于 2012-09-25 00:40 |显示全部楼层
很吊!都拍下来了。。回复 5# isaacxu


   

论坛徽章:
0
发表于 2012-09-25 01:10 |显示全部楼层
忘了说谢谢啦,你也是考了腾讯的笔试题?貌似那个出栈顺序有42种回复 5# isaacxu


   

论坛徽章:
0
发表于 2012-09-25 03:06 |显示全部楼层
本帖最后由 isaacxu 于 2012-09-25 05:32 编辑

回复 7# hubimaso
从July的博客上下载的照片,个人年岁也大了,况且从来不用QQ呀,当然更不可能去面腾讯了。算了一下C(2n,n)/(n+1),确实是42.
  1. #include "stdio.h"
  2.     int sum;
  3.     void dfs(int top,int head,int n)
  4.     {
  5.         if(head==n+1)
  6.         {
  7.             sum++;
  8.             return;
  9.         }
  10.         if(top>0)
  11.         {
  12.             dfs(top-1,head,n);
  13.         }
  14.         if(head<n+1)
  15.         {
  16.             dfs(top+1,head+1,n);
  17.         }
  18.     }
  19.     int main()
  20.     {

  21.         int n=5;
  22.         sum=0;
  23.         dfs(0,1,5);
  24.         printf("%d\n",sum);

  25.         return 0;
  26.     }
复制代码
出栈序列问题归纳

论坛徽章:
0
发表于 2012-09-26 10:39 |显示全部楼层
怎么这么厉害!你是怎么做到的:wink: 回复 8# isaacxu


   

论坛徽章:
1
天蝎座
日期:2013-12-06 18:23:58
发表于 2012-09-26 10:39 |显示全部楼层
第一个堆就可以解决了,空间占用小,时间也快

论坛徽章:
0
发表于 2012-09-26 10:41 |显示全部楼层
愿听其详 回复 10# crazyhadoop


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP