构建一个跨机房的Hadoop集群

介绍阿里巴巴离线数据处理的现状,大集群数据没有冗余,管理方便和数据共享,因此集群式需求,但是机房规模就是现阶段hadoop集群规模的上限,如何扩展? 扩展需要解决如下问题: 1)NameNode扩展 2)跨机房间的网络限制; 3)数据如何分布; 4)计算如何分布; 5)大数据的迁移; 6)如何做到用户透明; 7)能否扩展到>3的机房?
展开查看详情