免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块
查看: 1411 | 回复: 2
打印 上一主题 下一主题

【青岛招聘】网络爬虫及数据平台高级开发工程师 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-03-15 17:57 |只看该作者 |倒序浏览
【青岛招聘】网络爬虫及数据平台高级开发工程师

岗位职责:
对指定的多个网站的网页进行网页抓取、数据提取;
负责特殊网页采集任务的分析及采集方案设计;
参与爬虫架构设计和研发,满足产品中数据抓取的要求;
参与爬虫核心算法和策略优化研究;
抓取调度和策略优化,实时监控爬虫的进度和警报反馈;
爬虫核心系统, 数据平台的研发维护。

要求:
本科及以上学历,计算机相关专业;
具有数据挖掘、信息检索、机器学习开发经验;
精通HTML语言,熟悉JS,Ajax,熟悉Lucene、Nutch、Heritrix、larbin、HtmlParse、Scrapy、Crawler4j、WebMagic、WebCollector等开源工具;
精通网页抓取原理及技术,从结构化的和非结构化的数据中获取信息;
熟练使用一门以上脚本语言(PHP/PYTHON/JAVA/Node.js/SQL 等);
熟练Hadoop大数据平台的核心框架 (HDFS, Pig, Hive, Sqoop, oozie, Zookeeper, Spark, Storm, Kafka 等);
精通网络编程,熟悉HTTP传输协议,能模拟浏览器操作爬虫;
具备web挖掘等搜索引擎相关知识,有从事网络爬虫、网页去重、网页信息抽取的经验。
以解决技术难题为乐,对程序完美有偏执追求;具有团队精神,有想法,敢于挑战自我。


公司简介:
我们是一家年轻的科技公司,跨国经营,崇尚创新,坚持高效。
期待您的加入:qingdao@cathaydigital.com

简历请走邮箱,备注来自ChinaUnix,谢谢。

论坛徽章:
0
2 [报告]
发表于 2016-03-18 10:35 |只看该作者
签到来一发,up

论坛徽章:
0
3 [报告]
发表于 2016-03-23 11:29 |只看该作者

签到来一发,up
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP