Cloudera 月底将发布新的开源储存引擎 Kudu

jopen 8年前

外媒报道,大数据公司 Cloudera 正在开发一个大型的开源储存引擎 Kudu,用于储存和服务大量不同类型的非结构化数据。预计本月底发布。

Kudu 将被当作目前广泛使用的 Hadoop Distributed File System 和 Hadoop-oriented HBase NoSQL 数据库的替代产品,并将集合两者的特点。Kudu 将遵循 Apache 协议开源。

据说,Kudu 的扫描速度几乎和原生 HDFS 一样快,同时随机访问速度和 HBase 几乎一样快。不过,Kudu 并不打算替换掉 HDFS 或 HBase。Cloudera 未来也会继续支持 HDFS 和 HBase 。

Kudu 可用于时间序列数据,实时报告,模型构建。但它不是一个 SQL 查询引擎用来 pull 特定数据。Kudu 将集成 Impala,未来也将支持 Spark。此外,Kudu 的 API 可以使用 Java 和 C++。



来自:http://www.oschina.net/news/66556/cloudera-storage-engine-kudu