Apache Hive v2.1.0-rc0 发布

jopen 8年前
   <p style="text-align: center;"><img alt="" src="https://simg.open-open.com/show/988125c04f1b57cf3a5f7ea76d4aa4b2.png" /></p>    <p>Hive是一个基于Hadoop的开源数据仓库,用于存储和处理海量结构化数据。它是非死book 2008年8月开源的一个数据仓库框架,提供了类似于SQL语法的HQL语句作为数据访问接口,Hive有如下优缺点:</p>    <p>优点:</p>    <ul>     <li>Hive 使用类SQL 查询语法, 最大限度的实现了和SQL标准的兼容,大大降低了传统数据分析人员学习的曲线;</li>     <li>使用JDBC 接口/ODBC接口,开发人员更易开发应用;</li>     <li>以MR 作为计算引擎、HDFS 作为存储系统,为超大数据集设计的计算/ 扩展能力;</li>     <li>统一的元数据管理(Derby、MySql等),并可与Pig 、Presto 等共享;</li>    </ul>    <p>缺点:</p>    <ul>     <li>Hive 的HQL 表达的能力有限,有些复杂运算用HQL 不易表达;</li>     <li>由于Hive自动生成MapReduce 作业, HQL 调优困难;</li>     <li>粒度较粗,可控性差</li>    </ul>    <p> </p>    <p style="text-align: center;">Hive运行架构</p>    <p style="text-align: center;"><img alt="" src="https://simg.open-open.com/show/ef4c85fc0e2ee7dd847b329ae738878e.jpg" /></p>    <h2>下载</h2>    <ul>     <li><a href="/misc/goto?guid=4958991099490594332" rel="nofollow"><strong>Source code</strong> (zip)</a></li>     <li><a href="/misc/goto?guid=4958991099621476195" rel="nofollow"><strong>Source code</strong> (tar.gz)</a></li>    </ul>    <p><img src="file:///C:/Users/wqm/AppData/Local/Temp/enhtmlclip/Image(8).jpg" /></p>    <p> </p>