Hadoop 数据管理平台:Apache Falcon

jopen 9年前

Apache Falcon 提供了一个用于治理和编排 Hadoop 内部和周边数据流的数据处理框架。该框架为获取和处理数据集、复制与保留数据集、重新定向位于非Hadoop扩展中的数据集、维护审核跟踪与沿袭提供了关 键性的管控框架。Knox拓展了Hadoop的安全边界,实现了与LDAP、用于证书管理的活动目录等框架进行了充分整合,为跨Hadoop和所有相关项 目的授权提供了一个通用服务。

整体架构:

Hadoop 数据管理平台:Apache Falcon

Feed Schedule flow

Hadoop 数据管理平台:Apache Falcon

Process Schedule flow

Hadoop 数据管理平台:Apache Falcon

项目主页:http://www.open-open.com/lib/view/home/1421723815187