免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: tmp
打印 上一主题 下一主题

baidu mp3蜘蛛原理? [复制链接]

论坛徽章:
0
11 [报告]
发表于 2007-11-21 14:43 |只看该作者
我又来了,和大家说一下我测试下来的总结吧:

我找了个免费空间,弄了16首mp3, 并且每个mp3由一个包含歌手,曲名...的网页引用,    首页引用全部连接
1. 其中包含真正的mp3,    4首
2. 假的mp3(dd if=/dev/zero of=aaa.mp3 bs=1024k count=5)    6 首
3. 真假mp3, (真实的mp3,但是网页上的曲名,歌手都和这个mp3不对应)     4首
4. 错mp3, (真的mp3, 某些内容被随意修改过,忘记了曲名对应不对应了)     2首


10月17日到11月21日一个多月来:      (含蜘蛛,而且蜘蛛占了很大一部分)

1, 中的4首mp3被访问了 307983次
2,      59     (全是蜘蛛访问的,没有被收录,会不会是因为apache没有告诉蜘蛛这是一段数据,但不是mp3 ?)
3,     119526
4,     632      


由于是grep分析,所以很不准确,没有去掉蜘蛛的访问量.


另外歌曲的流行程度也不一样, 估计数据也没啥参考价值了

over.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP