开源计算框架:Apache Tez

jopen 9年前

Tez 是 Apache 最新的支持 DAG 作业的开源计算框架,它可以将多个有依赖的作业转换为一个作业从而大幅提升DAG作业的性能。Tez并不直接面向最终用户——事实上它允许开发者为最终用 户构建性能更快、扩展性更好的应用程序。Hadoop传统上是一个大量数据批处理平台。但是,有很多用例需要近乎实时的查询处理性能。还有一些工作则不太 适合MapReduce,例如机器学习。Tez的目的就是帮助Hadoop处理这些用例场景。

Tez的两大设计主题:

  • Empowering end users by:
    • Expressive dataflow definition APIs
    • Flexible Input-Processor-Output runtime model
    • Data type agnostic
    • Simplifying deployment
  • Execution Performance
    • Performance gains over Map Reduce
    • Optimal resource management
    • Plan reconfiguration at runtime
    • Dynamic physical data flow decisions

开源计算框架:Apache Tez

开源计算框架:Apache Tez

项目主页:http://www.open-open.com/lib/view/home/1445476116710