免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4903 | 回复: 4
打印 上一主题 下一主题

[算法] 如何得到每日排行榜 [复制链接]

论坛徽章:
27
水瓶座
日期:2014-08-22 21:06:34程序设计版块每日发帖之星
日期:2015-11-25 06:20:0015-16赛季CBA联赛之新疆
日期:2015-12-19 19:05:48IT运维版块每日发帖之星
日期:2015-12-25 06:20:31IT运维版块每日发帖之星
日期:2015-12-25 06:20:31IT运维版块每日发帖之星
日期:2015-12-25 06:20:3315-16赛季CBA联赛之上海
日期:2016-04-15 19:51:31程序设计版块每日发帖之星
日期:2016-04-17 06:23:29程序设计版块每日发帖之星
日期:2016-04-23 06:20:00程序设计版块每日发帖之星
日期:2016-05-26 06:20:00每日论坛发贴之星
日期:2016-05-26 06:20:0015-16赛季CBA联赛之辽宁
日期:2017-02-16 23:59:47
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-10-24 21:10 |只看该作者 |倒序浏览

论坛徽章:
0
2 [报告]
发表于 2014-10-25 07:48 |只看该作者
这是什么意思?抓取网页,然后分析其中的内容不就得到了么?

论坛徽章:
0
3 [报告]
发表于 2014-10-27 10:22 |只看该作者
继续!等着下文呢 !

论坛徽章:
27
水瓶座
日期:2014-08-22 21:06:34程序设计版块每日发帖之星
日期:2015-11-25 06:20:0015-16赛季CBA联赛之新疆
日期:2015-12-19 19:05:48IT运维版块每日发帖之星
日期:2015-12-25 06:20:31IT运维版块每日发帖之星
日期:2015-12-25 06:20:31IT运维版块每日发帖之星
日期:2015-12-25 06:20:3315-16赛季CBA联赛之上海
日期:2016-04-15 19:51:31程序设计版块每日发帖之星
日期:2016-04-17 06:23:29程序设计版块每日发帖之星
日期:2016-04-23 06:20:00程序设计版块每日发帖之星
日期:2016-05-26 06:20:00每日论坛发贴之星
日期:2016-05-26 06:20:0015-16赛季CBA联赛之辽宁
日期:2017-02-16 23:59:47
4 [报告]
发表于 2014-10-27 21:09 |只看该作者
会当凌绝顶聪 发表于 2014-10-27 10:22
继续!等着下文呢 !
  1. -module(sohu_tv).
  2. -compile([export_all]).

  3. -define(USER_AGENT_HEADER,{"User-Agent","Mozilla/5.0 (Windows NT 6.0) AppleWebKit/534.24 (KHTML, like Gecko) Chrome/11.0.696.68 Safari/534.24"}).
  4. -define(LOG_FILE,?MODULE ++ ".log").
  5. -define(LINKS_FILE,"links.log").

  6. go()->
  7.     inets:start(),
  8.     case httpc:request(get,{"http://tv.sohu.com/hotdrama/?d",[?USER_AGENT_HEADER]},[{autoredirect,false}],[]) of
  9.     {ok, {{_Version, StatusCode, _ReasonPhrase}, _, _Body}} when StatusCode==301; StatusCode==302 ->
  10.         StatusCode;
  11.     {ok, {{_Version, _StatusCode, _ReasonPhrase}, _Headers, Body}} ->
  12.        parse_links(Body);
  13.     {error,Reason} ->
  14.         [Reason]
  15.     end.


  16. parse_links(Body) ->
  17.     Regexp = "href\s*?=\s*?\"([^\"]+?)\"",
  18.     case re:run(Body,Regexp,[{capture,all,list},global]) of
  19.     {match,Matches} ->
  20.         [file:write_file(?LINKS_FILE,Link ++ "\r\n",[append]) || [_Match,Link] <- Matches];
  21.     nomatch ->
  22.         []
  23.     end.   

  24. log_timestamp() ->
  25.     {{Year,Mon,Day},{Hour,Min,Sec}} = erlang:localtime(),   
  26.     io_lib:fwrite("~w/~2.2.0w/~2.2.0w ~2.2.0w:~2.2.0w:~2.2.0w",[Year,Mon,Day,Hour,Min,Sec]).

  27.    
  28.    
复制代码

论坛徽章:
27
水瓶座
日期:2014-08-22 21:06:34程序设计版块每日发帖之星
日期:2015-11-25 06:20:0015-16赛季CBA联赛之新疆
日期:2015-12-19 19:05:48IT运维版块每日发帖之星
日期:2015-12-25 06:20:31IT运维版块每日发帖之星
日期:2015-12-25 06:20:31IT运维版块每日发帖之星
日期:2015-12-25 06:20:3315-16赛季CBA联赛之上海
日期:2016-04-15 19:51:31程序设计版块每日发帖之星
日期:2016-04-17 06:23:29程序设计版块每日发帖之星
日期:2016-04-23 06:20:00程序设计版块每日发帖之星
日期:2016-05-26 06:20:00每日论坛发贴之星
日期:2016-05-26 06:20:0015-16赛季CBA联赛之辽宁
日期:2017-02-16 23:59:47
5 [报告]
发表于 2014-10-27 21:09 |只看该作者
您给改改
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP