免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: Gray1982
打印 上一主题 下一主题

[Hadoop&HBase] 【讨论】海量数据分析之Hadoop(获奖名单已公布-2012-5-28) [复制链接]

论坛徽章:
0
61 [报告]
发表于 2012-05-12 22:14 |只看该作者
回复 60# yifangyou


    应该关注的 IOE之后  如何 MySQL /NOSQL + hdfs的应用及实现方式

论坛徽章:
1
天蝎座
日期:2013-12-06 18:23:58
62 [报告]
发表于 2012-05-12 22:27 |只看该作者
回复 58# bbjmmj


    哈~ 不敢认同你这个说法~

论坛徽章:
0
63 [报告]
发表于 2012-05-12 22:27 |只看该作者
本帖最后由 kns1024wh 于 2012-05-12 22:30 编辑

回复 1# Gray1982

可以这样来说,玩过LVS+ HA+ Cache +Menory DB的运维达人的技术趋向比人是Hadoop 为主导的云计算方向;
Hadoop的是java基础环境,所以部署很简单
以下对做简要的理解交流

1,Hadoop所应用的环境
需要计算的场景,计算这个是一个很亲切又笼统的一个概念,何为计算???
从计算角度如前一阶段cu上热烈讨论的12306 就是可以变更为Hadoop的应用模式,在Hadoop上完成 Map Reduce 的计算工作将复杂的数据逻辑变成简洁的1 2 3 就可以快捷相应;

Hadoop的场景就是计算;

电信行业的业务BOSS类的系统也可以Hadoop

搜索引擎体现的更为明显,源于hadoop的仿效谷歌--

renren mop 都在用 hadoop 还有很多也都在用
2,Hadoop所在平台级优化
如果仁兄是用PC来做Hadoop哪个就是比较的扯了,Hadoop的计算优势的对比是与IBM+Oracle+EMC进行对对比的,
小鸡、甲骨文、存储
Hadoop部署的PC Server 上,100-1000规模的计算能力的客观度很高
Hadoop的优化是与业务相关的以及选择的应用API

3,Hadoop配置参数优化
几个datanode 复制数量 这个要看业务应用,存储设备是是sas ssd? sata scisci ?
核心的hadoop配置参数就是3-4个,通过官方的提示可以扩充很多的优化信息

4,Hadoop代码级优化
如同MySQL Linux kernel 要性能更高就必须优化代码 code级别来解决问题

5,Hadoop的MR其它语言编写(Python等)
Python这个入门级别低  Java这个是优选的

论坛徽章:
0
64 [报告]
发表于 2012-05-12 22:38 |只看该作者
回复 61# kns1024wh


    他说的是不用Hadoop,用单机跑分析日志
不做分布式,用hadoop干嘛啊

论坛徽章:
9
技术图书徽章
日期:2014-10-14 15:48:13数据库技术版块每日发帖之星
日期:2015-06-04 22:20:00数据库技术版块每日发帖之星
日期:2015-06-10 22:20:00数据库技术版块每日发帖之星
日期:2015-06-11 22:20:00数据库技术版块每日发帖之星
日期:2015-06-13 22:20:00IT运维版块每日发帖之星
日期:2015-09-22 06:20:00IT运维版块每日发帖之星
日期:2015-12-08 06:20:00综合交流区版块每日发帖之星
日期:2016-02-02 06:20:00IT运维版块每日发帖之星
日期:2016-07-25 06:20:00
65 [报告]
发表于 2012-05-12 22:39 |只看该作者
crazyhadoop 发表于 2012-05-12 22:27
回复 58# bbjmmj


据说美国政府投资两亿美金研究大数据——两亿美金,都不够很多大学一年的开销,两亿美金几乎等于零投入,美国政府不信大数据,咱也别信大数据。
摩尔定律让电脑芯片速度暴增,但机械硬盘在速度上却没能追得上去,而固态存储的容量又远远不够,而且价格太高,所以现在电脑科技最大的难题是外存储器,目前IT界所有关于大系统的炒作全部都是因为外存储器,这是问题的根本,本贴就是专门聊外存的。

论坛徽章:
0
66 [报告]
发表于 2012-05-12 23:01 |只看该作者
回复 64# kns1024wh


    兄台,345能来几个代码吗

论坛徽章:
0
67 [报告]
发表于 2012-05-12 23:02 |只看该作者
本帖最后由 kns1024wh 于 2012-05-12 23:03 编辑

回复 1# Gray1982


    hadoop-0.20.2.tar.gz 版本在CU下载可以找到了:wink:


http://download.chinaunix.net/download/0014000/13378.shtml

论坛徽章:
0
68 [报告]
发表于 2012-05-12 23:04 |只看该作者
回复 67# Gray1982


    呵呵

   从来不写code 代码木有呀  

   关于Hadoop的架构上的事情 还是可以聊聊的

论坛徽章:
0
69 [报告]
发表于 2012-05-12 23:05 |只看该作者
bbjmmj 发表于 2012-05-12 15:51
世上根本就没有什么Big Data,有的只是高速的运算芯片从龟速硬盘里面拽数据,为了提高I/O,不得不加大硬 ...

估计说的是海量文件,不是说单一文件的大小

论坛徽章:
0
70 [报告]
发表于 2012-05-12 23:15 |只看该作者
回复 67# Gray1982

conf
hadoop-site.xml
core-site.xml
mapred-site.xml
hdfs-site.xml
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP