Uber是如何扩展他们的实时市场平台的

jopen 8年前

来自：http://www.infoq.com/cn/articles/how-buer-expand-their-real-time-market-platform

据了解，在短短四年间， Uber已经惊人地增长了38倍。最近，Uber的首席系统架构师 Matt Ranney 在他的报告“ 扩展Uber的实时市场平台”中，对Uber软件系统的工作原理进行了一个有趣而又详细的介绍。本文对Matt的报告内容作了一个简单的总结。本文是一篇翻译稿，原文题目为“ How Uber Scales Their Real-Time Market Platform”，已获得作者授权。

在Matt的报告中，给人印象最深刻的是Uber的快速增长。他们对于系统架构所做的很多选择都是基于公司规模的快速增长。很多技术都运行在后台，因为尽可能地让团队快速运转一直是他们的主要目标。

经过开始时期一个短暂的混乱阶段之后，Uber已经从自身的业务中学习到了很多，包括成功所真正需要的东西。他们早期的调度系统主要是面向移动的人。而现在，除了人之外，Uber的任务已经发展到处理箱子和杂货，他们的调度系统已经被抽象化，并且构建了非常坚实和智能化的基础架构。

虽然Matt认为，他们的架构可能有一些疯狂，但是使用附带gossip协议的一致性哈希ring的想法似乎正好符合他们的实际情况。

不被Matt的工作热情所吸引是很困难的。在谈到他们的调度系统DISCO的时候，他非常兴奋地说到，这实际上就像一个很酷的计算机科学问题，即旅行商问题。尽管该解决方案不是最佳的，但将其想象为一个真实世界中旅行商，他具有一个有趣的规模，而且是实时的，内置了容错可伸缩的组件。这多酷啊！

本文中，我们介绍了Uber的调度系统，他们是如何实现地理空间索引，他们是如何扩展他们的系统，他们是如何实现高可用性，以及他们如何处理系统故障，包括当出现数据中心故障的时候，通过将司机的手机作为一个外部分布式存储系统，Uber采用了一种非常出色的系统恢复方式。

统计

Uber地理空间索引的目标是以每秒百万次的速度写入，以及以写入速度数倍的速度读出。
该调度系统具有数千个节点。

平台

Node.js
Python
Java
Go
iOS和Android系统上的本地应用程序
Microservices
Redis
Postgres
MySQL
Riak
推ter Twemproxy
Google的S2 Geometry Library
ringpop—一致性哈希ring
TChannel—RPC网络复用和成帧协议
Thrift

架构概述

驱动这一切的是使用移动电话运行原生应用程序的乘客和司机。
后端主要为移动电话之间的信息处理服务。客户端与后端之间的通信是通过移动数据和尽力而为的互联网。
客户端连接到调度系统，以匹配乘客和司机之间的供应和需求。
调度系统几乎完全用Node.js编写。
- 过去计划将其移动到io.js，但之后io.js和Node.js合并所以放弃了。
- 你可以在JavaScript上做一些有趣的分布式系统工作。
</li>
整个Uber系统可能看起来很简单。但这种简单的方式就是成功的标志。只要它看起来足够简单，他们的工作就完成了。
地图/ ETA（预计到达时间）。在调度过程中，获取地图和路由信息对于最终做出明智的选择是非常必要的。
- 街道地图和历史出行时间被用来估计当前的出行时间。
- 使用的语言很大程度上取决于系统所要集成的内容。因此，语言包括Python，C ++和Java。
- 服务。存在大量的业务逻辑服务。
  - 微服务。
  - 大多用Python编写。
  - 数据库
    - 最早的系统是用Postgres编写。
    - 使用Redis。一些是在Twemproxy中，一些是在自定义集群系统中。
    - MySQL
    - Uber 正在构建自己分布式列存储，以存储MySQL实例。
    - 一些调度服务保存状态在Riak中。
    - 评论和反馈。一次出行完成之后还需要大量的处理。
      - 收集评分。
      - 发送电子邮件。
      - 更新数据库。
      - 计划付款。
      - 用Python编写。
      - 费用。Uber集成了多种支付系统。

Uber是如何扩展他们的实时市场平台的

统计

平台

架构概述

旧的调度系统

新的调度系统

调度

地理空间索引

路由

扩展调度

调度可用性

整个数据中心失效

不足

相关经验

目录