hadoop再次集群搭建(3)-如何选择相应的hadoop版本

jopen 8年前

之前接触过很多很多hadoop版本,现在重新搭建平台,面临选择哪个版本的问题。


当我们决定是否采用某个软件用于开源环境时,通常需要考虑以下几个因素:
1 )是否为开源软件,即是否免费。
2   是否有稳定版,这个一般软件官方网站会给出说明。
3   是否经实践验证,这个可通过检查是否有一些大点的公司已经在生产环境中使用知道。
4   是否有强大的社区支持,当出现一个问题时,能够通过社区、论坛等网络资源快速获取解决方法。
对于版本选择, dongxicheng在他的博客中做过总结:  点击这个链接可以查看。 </div>

版本一览表:

现在最新的版本截图:

Apache Hadoop的版本,目前有1.x 和 2.x版本。3.x版本在测试中。

1.x版本,比较经典,使用者很多。2.x版本,和1.x并不兼容。2.x完全推翻了1.x的代码,重新编写的。内部思想有借鉴。

 

A.经典版本 0.20.2 → 1.0.0 (第一个1.0.0的正式版本) → 1.0.3和1.0.4 (生产环境使用的较多的版本) → 1.1.2, 1.2.1(目前最新版本)

 

B.上面的0.21.0和0.22.0 这个分枝,就不提了。

 

C.下面说0.23.0(跨越版本,Yarn框架,第二代MapReduce框架,资源管理和任务调度框架) → xxx →0.23.10(目前最新版本,不过和2.x有点区别,就是不支持HA和Federation)

 

D.下面就是2.x版本了。将1.x和0.23.0系列合并。

①2.0.x版本:属于2.x系列版本的alpha版本。

②2.1.x版本:属于2.x系列版本的beta版本。

③2.2.0 ,2.3.0 , 2.4.0 正式版本,可用于实际生产环境中。


大部分情况下,我们可以选择

Apache社区版本:
完全开源,免费,非商业。apache社区的hadoop版本分枝较多,而且部分hadoop存在bug。在选择hadoop,hbase,hive等时,需要考虑兼容性。

Cloudera版本:
开源,免费,有商业和非商业版本。是在apache社区版本的hadoop基础上,选择相对稳定版本的hadoop,并在此基础上,进行bug修改和维护。使用者不必考虑hadoop,hbase,hive等在使用过程中,版本兼容性。

Hortonworks版本:
开源,免费,有商业和非商业版本。是在Apache基础上修改,具有apache的特色。

推荐:
实验环境使用cloudera,生产环境,看情况而定。

我分别询问了两个朋友,一个刚刚在平安信托任职大数据岗位,使用的版本是1.X,第二个朋友在安富利任职工程师,推荐我使用cloudera manager5.4.3 对应的hadoop是2.6。由此可知,2.6是最新的版本了,之前我使用的是1.2.1,现在也是时候使用更新的版本了。个人认为,如果是学习,就要学习最新的,如果是生产环境,就要用老一点的版本。

经过纠结,决定选择 cloudera manager5.4.3 对应的hadoop是2.6。cloudera manager可以很方便的安装hadoop,方便使用。


Charles 于2015-12-17 Phnom Penh



版权说明:
本文由Charles Dong原创,本人支持开源以及免费有益的传播,反对商业化谋利。
CSDN博客:http://blog.csdn.net/mrcharles
</div>
个人站:http://blog.xingbod.cn
EMAIL:charles@xingbod.cn
</div>

来自: http://blog.csdn.net//mrcharles/article/details/50340149