- 论坛徽章:
- 0
|
1、您在使用大数据分析时,碰到过哪些困扰和挑战?具体到硬件层面,您在系统性能、拓展性、稳定性、高可用性等方面是否碰到瓶颈, 数据库之间的连接等等?
在使用大数据分析时,遇到的一个困扰就是如何确定数据的边界。虽然大数据是要有海量的基础数据为支撑,但就算是海也有边界,如何确定这个边界其实没有定论,关键还是要实施者自己来把控。
具体到硬件层面,在拓展数据库服务器时,确保新加入数据库的稳定和性能也是难点之一。尤其当存在不同种类数据库时,在稳定性以及数据库之间互联方面需要加以注意。
2、为提高Hadoop、NoSQL、MongoDB的性能,您一般会采用什么样的方法?现有的方法还存在哪些不足?
为提高性能,从硬件上来讲我会增加服务器的内存,并且考虑固态硬盘。
这些方法能一定程度上提升Hadoop、NoSQL或者MongoDB性能,但是提升空间有限,毕竟不可能无限制地购买内存和更换硬盘。而且也会受到系统架构的制约。
3、在部署大数据方案时,您是如何进行IT硬件选型的,主要会考虑哪些因素?
CPU通常考虑四核低功耗CPU,包括低功率的电源配置,能够支撑八核心低功耗设备。
两个六核处理器(6核12线程),可支持96个基本的虚拟机(VM),最大支持96 GB 的内存。
利用闪存驱动器启动服务器管理程序,将来可以考虑把操作系统和一些小型的服务器应用,如LAMP放到闪存当中运行。
4、对于IBM推出的上述大数据方案,您是否会考虑迁移测试?为什么?
暂时还不会考虑迁移测试,因为系统目前运行稳定,而且没有严重的性能瓶颈。 |
|