- 论坛徽章:
- 0
|
1、您在使用大数据分析时,碰到过哪些困扰和挑战?具体到硬件层面,您在系统性能、拓展性、稳定性、高可用性等方面是否碰到瓶颈, 数据库之间的连接等等?
数据量的指数级增长对存储空间要求越来大,实时分析海量的数据对计算能力要求越来越高;数据庞大,对数据库的要求更高,使得数据库出现性能瓶颈;用户的应用和分析结果呈整合趋势,对实时性和响应时间要求越来越高;
由于存在上面这些困扰和挑战,具体到硬件层面,在各个层面都会有一定的压力,并且在高可用性能方面的瓶颈更为突出。
2、为提高Hadoop、NoSQL、MongoDB的性能,您一般会采用什么样的方法?现有的方法还存在哪些不足?
使用排序 :分清任务的重要性,优先级高的先执行。
使用多线程:分解任务和数据,充分利用CPU的多核心多线程。
使用多个数据库 。将不同的线程结果输出至不同的数据库,避免线程之间的相互等待。
现有的方法存在的不足:算法模型越来越复杂,对计算的要求越来越高。
3、在部署大数据方案时,您是如何进行IT硬件选型的,主要会考虑哪些因素?
统一规划、技术领先、成本适中、品牌影响力、成功案例
4、对于IBM推出的上述大数据方案,您是否会考虑迁移测试?为什么?
不考虑迁移测试, 如果迁移测试,将面临诸多风险:
对IBM的大数据方案不熟悉,可能导致迁移失败。
迁移测试的成本比较高,需要耗费精力来做这件事情,迁移之后不好用,还需要再次迁移回来。
迁移之后系统运行是否稳定、是否会出现未知问题等等并且在迁移测试过程中,还可能面临系统运行是否稳定等各种问题
|
|