高性能分析数据库 Impala 升级为 Apache 顶级项目

jopen 9年前
   <p>Apache 软件基金会宣布 Apache  Impala 孵化成功，升级为顶级项目。</p>    <p>Impala 是一个高性能分析数据库，可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式 SQL 查询。Impala 还是一个现代化，大规模分布式，大规模并行的 C ++ 查询引擎，可以分析，转换和合并来自各种数据源的数据。大规模并行处理（MPP） SQL 查询引擎允许通过 SQL 或商业智能工具对存储在本地（在 HDFS 或 Apache Kudu 中）或在云对象存储中存储的数据进行分析查询，而无需将数据集迁移到专用系统或专有格式。</p>    <p>Impala 提供：</p>    <ul>     <li> <p>在 Apache Hadoop 中查询大量数据（大数据）的能力；</p> </li>     <li> <p>集群环境中的分布式查询；</p> </li>     <li> <p>在不同组件之间共享数据文件的能力，无需复制或导出/导入步骤；</p> </li>     <li> <p>用于大数据处理和分析的单一系统。</p> </li>    </ul>    <p><img alt="高性能分析数据库 Impala 升级为 Apache 顶级项目" src="https://simg.open-open.com/show/21ea92c879f3f54c5c24b8af6774569a.jpg" /></p>    <p>Impala 的灵感来自 Google 将查询处理与存储管理分离开来的 F1 数据库，最初于2012年发布，并于2015年12月进入 Apache 孵化。</p>    <p>Impala 项目创始人 Marcel Kornacker 表示：“2011年，我们开始开发 Impala ，以便为用户提供最先进的开源 SQL 分析。 Apache 顶级项目的毕业典礼是对这个项目背后的优秀开发者社区的肯定。”</p>    <p> </p>
高性能分析数据库 Impala 升级为 Apache 顶级项目

相关资讯