免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: benjiam
打印 上一主题 下一主题

今天给人出道网络方面的题目 [复制链接]

论坛徽章:
1
双子座
日期:2014-08-29 17:15:03
11 [报告]
发表于 2010-08-26 14:53 |只看该作者
面試剛畢業的么?

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
12 [报告]
发表于 2010-08-26 15:03 |只看该作者
把 wget  里的代码搞出来就可以了。

wget 功能全。



不过,我也去找工作面试过, 最看不掼 公司先不精心准备面试题, 胡乱喊个人,一拍脑门出个面试题目了。

遇到这样的情况, 我就找个借口走了。


我一直想不明白的是,象这样垃圾的 公司, 为什么能赚上钱,不倒闭呢。

论坛徽章:
0
13 [报告]
发表于 2010-08-26 15:12 |只看该作者
wget

或者用
jdic写个啊,那玩意简单。快

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:50:28
14 [报告]
发表于 2010-08-26 15:51 |只看该作者
这种活,应该用python 或 perl。

论坛徽章:
0
15 [报告]
发表于 2010-08-26 16:50 |只看该作者
把 wget  里的代码搞出来就可以了。

wget 功能全。



不过,我也去找工作面试过, 最看不掼 公司先 ...
goldenfort 发表于 2010-08-26 15:03



   

题目很基础。

你能把wget 代码的代码部分取出来, 编成可执行文件 ,符合我的要求。我也算你能通过。

简单 你现在就贴代码包吧.

如果认为有本事的 可以写个爬虫 和我的比比

你可以去爬一下 www.shoufang.com  每天把上海所有的房产数据抓下来 然后整理出来。
去掉重复的。得出一个源数据。

论坛徽章:
0
16 [报告]
发表于 2010-08-26 16:56 |只看该作者
建意LZ写完代码做房屋中介吧。比程员赚的多。

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
17 [报告]
发表于 2010-08-26 17:14 |只看该作者
本帖最后由 goldenfort 于 2010-08-26 17:18 编辑

回复 15# benjiam


这个应该简单,  直接用wget就可以了, wget也可以自动去重复的URL  可以指定递归层次。

爬虫除了 抓需要注册的网站外, 没有什么技术困难。

困难在 你 抓到网页后,如何分类整理,  

分类整理, 需要理解网页的语义, 才能做的好。  这个就比较复杂了。


我 也做过爬虫, 除了能抓网页, 还能统计  反向联接数。用多进程 ,速度飞快。

问题是, 你就是做的比baidu好, 没有资本平台, 赚不上钱。
就是有资本平台, 比如网易 有道  也做的不错,
可是,别人建设多年的名声在外, 还是没有人使用。

论坛徽章:
0
18 [报告]
发表于 2010-08-31 13:41 |只看该作者
不懂!路过!!!

论坛徽章:
0
19 [报告]
发表于 2010-08-31 13:54 |只看该作者
回复  benjiam


这个应该简单,  直接用wget就可以了, wget也可以自动去重复的URL  可以指定递归层次 ...
goldenfort 发表于 2010-08-26 17:14



    我跟你讲道理
   你和我耍流氓
  我和你耍流氓
  你和我讲政治
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP