基于Hadoop的数据仓库平台,Apache Hive 1.2.1 发布

jopen 9年前

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

Hive是非死book 2008年8月刚开源的一个数据仓库框架,其系统目标与 Pig 有相似之处,但它有一些Pig目前还不支持的机制,比如:更丰富的类型系统、更类似SQL的查询语言、Table/Partition元数据的持久化等。

Apache Hive 1.2.1 发布,此版本主要改进内容如下:

改进

  • [HIVE-8769] - Physical optimizer : Incorrect CE results in a shuffle join instead of a Map join (PK/FK pattern not detected)

  • [HIVE-10812] - Scaling PK/FK's selectivity for stats annotation

  • [HIVE-10900] - Fix the indeterministic stats for some hive queries

新特性

  • [HIVE-10636] - CASE comparison operator rotation optimization

  • [HIVE-10716] - Fold case/when udf for expression involving nulls in filter operator.

详细改进说明和下载请看:https://hive.apache.org/downloads.html 

更多内容请看:
https://issues.apache.org/jira/secure/ReleaseNote.jspa?version=12332384&styleName=Text&projectId=12310843 

来自:http://www.oschina.net/news/63769/hive-1-2-1