高性能分析数据库 Impala 升级为 Apache 顶级项目

jopen 5年前
   <p>Apache 软件基金会宣布 Apache  Impala 孵化成功,升级为顶级项目。</p>    <p>Impala 是一个高性能分析数据库,可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式 SQL 查询。Impala 还是一个现代化,大规模分布式,大规模并行的 C ++ 查询引擎,可以分析,转换和合并来自各种数据源的数据。大规模并行处理(MPP) SQL 查询引擎允许通过 SQL 或商业智能工具对存储在本地(在 HDFS 或 Apache Kudu 中)或在云对象存储中存储的数据进行分析查询,而无需将数据集迁移到专用系统或专有格式。</p>    <p>Impala 提供:</p>    <ul>     <li> <p>在 Apache Hadoop 中查询大量数据(大数据)的能力;</p> </li>     <li> <p>集群环境中的分布式查询;</p> </li>     <li> <p>在不同组件之间共享数据文件的能力,无需复制或导出/导入步骤;</p> </li>     <li> <p>用于大数据处理和分析的单一系统。</p> </li>    </ul>    <p><img alt="高性能分析数据库 Impala 升级为 Apache 顶级项目" src="https://simg.open-open.com/show/21ea92c879f3f54c5c24b8af6774569a.jpg" /></p>    <p>Impala 的灵感来自 Google 将查询处理与存储管理分离开来的 F1 数据库,最初于2012年发布,并于2015年12月进入 Apache 孵化。</p>    <p>Impala 项目创始人 Marcel Kornacker 表示:“2011年,我们开始开发 Impala ,以便为用户提供最先进的开源 SQL 分析。 Apache 顶级项目的毕业典礼是对这个项目背后的优秀开发者社区的肯定。”</p>    <p> </p>