Uber 上市背后那些开源软件

OPEN编辑 3个月前

  当地时间 5 月 10 日上午,出行巨头 Uber 在纽交所挂牌上市,股票代码为“UBER”。这可能是 2019 年美股市场规模最大的 IPO。Uber 上市的表现以及公司巨亏的现状等等跟技术无关的问题交给华尔街的那些专家们去分析。

  咱们只讨论支持 Uber 技术的那些开源软件:

  AresDB —— AresDB 是 Uber 开源的一个基于 GPU 运算的实时分析存储引擎和查询引擎。具备低查询延迟、高数据刷新率和高效内存和磁盘存储管理。AresDB 要求 CUDA Toolkit 的支持。

  Fusion.js —— Uber 的 Web 平台团队开发 Fusion.js,一个开源的 Web 框架,用于简化 Web 开发,并构建出高性能的轻量级 Web 应用程序。

  Petastorm —— Petastorm 是由 Uber ATG (Advanced Technologies Group) 开发的开源数据访问库。这个库可以直接基于数 TB Parquet 格式的数据集进行单机或分布式训练和深度学习模型评估。

  M3 —— M3 是 Uber 开源的一个基于分布式时序数据库 M3DB 构建的度量平台,可每秒聚合 5 亿个指标,并且以每秒 2000 万笔的速度持续存储这些结果。

  Uber JVM Profiler  —— JVM Profiler 是 Uber Engineering 团队开源的一个分布式探查器,用于收集性能和资源使用率指标为进一步分析提供服务。

  RIBs —— RIBs 是 Router、Interactor 和 Builder 的简称,是 Uber 许多移动端应用背后的跨平台架构。

  AthenaX —— AthenaX 是 Uber 的内部流分析平台,同时支持着 Uber 的技术与非技术客户,确保其能够利用结构化查询语言(简称 SQL)运行全面的生产级流分析任务。

  Jaeger  —— Jaeger 是 Uber 的分布式跟踪系统,Jaeger 客户端库中的轮询功能旨在解决这些问题。通过将关于适当采样策略的决定移动到跟踪后端,我们免除服务开发人员猜测适当的采样率。

  Chaperone —— 作为 Kafka 审计系统,Chaperone 监控数据流的完整性和延迟。审计指标持久存储在数据库中,供 Kafka 用户量化其主题的损失。

  Ludwig —— 这是一款基于 Google TensorFlow 框架上的开源工具箱。藉由 Ludwig,用户无需再编写任何代码即可进行深度学习的开发。

  Hudi —— Hudi 旨在解决 Uber 大数据生态系统中需要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问题