实时大数据分析平台:Ebay Pulsar

jopen 9年前

Pulsar 是 eBay 开源的实时大数据分析平台。

作为全球性的商务平台和支付行业领先者,拥有海量的用户行为数据。 基于现有的hadoop大数据处理,已经不能够满足业务上对实时性的需求。基于过去的大数据处理的经验和对最新技术的运用,探索出一个对海量的数据流进行 实时的收集,处理,分发和分析的平台。并于2015年2月底开源此平台: Pulsar。

Pulsar 作为一个复杂事件处理平台,具有快速,准确,灵活的特性,保证点到点的低延时和高可靠,从而很好得满足了的eBay秒级实时数据分析的需求。同时每秒百万 级流量处理能力,给客户带来更好的个性化体验,帮助客户监控实时业务信息并定制实时营销策路,及时监测网络欺诈行为并减少机器人干预。并且Pulsar是 基于标准的分布式云架构部署并跨越多个数据中心,从而保证了在系统升级和拓扑更新时没有集群停机时间。

实时大数据分析平台:Ebay Pulsar

Pulsar 平台提供了一个完整的实时大数据分析的解决方案:

Pulsar architecture

该平台能够实时收集 Event Stream,并且对 Event 进行实时的 Enrichment 和 Sessionization,推送到不同的实时应用,同时能够实时的进行统计和分析,对业务提供 Key insights.

在 Pulsar 平台内部,它把 Event Stream 看成一种类数据库的表,在上面通过应用申明式的4GL来定义Business logic. 并且同时开源了作为支撑Pulsar 的一个全新的大数据流处理框架: Pulsar Jetstream.

Pulsar.Stream 是一个通用的全新的大数据流的处理框架。他实现了一个开放的,自动发现的Topology, 不同的应用可以分布在不同的Data center, 通过网络进行自动的发现并且建立连接,数据主动从Producer推送到Subscriber. 在每个应用内部,通过Pipeline的方式连接各个业务模块,并且支持用4GL的EPL来定义业务逻辑。整个的topology是开放的并且能够动态扩 展,相应的EPL也能够进行动态的更新且没有服务中断。

典型的部署结构

EPL

介绍来自 CSDN

项目主页:http://www.open-open.com/lib/view/home/1425437328103