免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4005 | 回复: 1

python flask图片网站 [复制链接]

论坛徽章:
0
发表于 2014-04-22 08:31 |显示全部楼层
本帖最后由 butterinsect 于 2014-04-22 08:31 编辑

都说豆瓣妹纸好,谁约谁知道。。。


http://dadanshai.com

经常逛豆瓣,请不要害羞等几个小组亮瞎了我的双眼,不能直视,三观尽毁。在内心里默默念道以后再也不上这些小组了。..., 可意识坚定敌不过菇凉白花花的大腿。然后每天就翻这些帖子,可翻这些帖子太花时间了。我只喜欢看菇凉不喜欢看评论神马的,然后就动手把小组里的图片抓下来然后以瀑布流的形式展示。独乐乐,不如众乐乐,但不要叫我雷锋...

这些菇凉晒的尺度为什么这么大啦?我想原因大概如下:

豆瓣是一个陌生人社区,小组里的人基本上在现实社会中没有交集,所以基本上没有心理负担。

这些菇凉想迅速的让他人了解,认可。菇凉常常会说如果评论超过500楼,会上高清、正面的大图,喜欢的数目、评论的数目、yp豆油的数目她们都很在意的,这些数字反应了他人对她外表的认可。

还有一部分是偶尔空虚寂寞冷发图的。

下面说说大胆晒的技术实现细节。

抓取用scrapy,每一个小时抓取一次,然后把结果保存为json文件。豆瓣对访问次数有限制,我用了http://www.samair.ru/proxy-by-country/China-01.htm上的代理,获取这些代理以后需要验证是否是匿名代理,并且验证访问豆瓣的速度,目前滤掉了连接和读取时间超过3s的代理。

定时脚本然后把数据录入到数据库中,把图片存放到beansdb中。

网站用了我最喜欢的flask,django太笨重了有木有,除了可以参考flask的官方文档外还可以参考http://blog.miguelgrinberg.com/p ... -part-i-hello-world, 前端用了bootstrap,masonry。

部署采用nginx+gunicorn, gunicorn作为python-cgi的容器,可以参考http://www.onurguzel.com/how-to- ... inx-using-gunicorn/, 顺便吐槽下开始准备用uwsgi,在网上找了半天资料都没有搞定然后转投gunicorn了..

后台的人工审核,定时会把漏点或低质的图片删掉。

网址是http://dadanshai.com

我的豆瓣是http://www.douban.com/people/yytv5/, 羞涩了,掩面。。

论坛徽章:
0
发表于 2014-04-22 15:24 |显示全部楼层
亲的小站开源木有?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP