互联网架构为什么要做服务化?

CatBach 4年前
   <p>近期参加一些业界的技术大会, “ 微服务架构 ” 的话题非常之火,也在一些场合聊过服务化架构实践,最近几期文章期望用通俗易懂的语言聊聊了个人对服务化以及微服务架构的理解,希望能给大伙一些启示。 如果有遗漏,也欢迎大家补充 。</p>    <h2><strong>一、互联网高可用架构,为什么要服务化? </strong></h2>    <p>【服务化之前高可用架构】</p>    <p>在服务化之前,互联网的高可用架构大致是这样一个架构:</p>    <p><img src="https://simg.open-open.com/show/048aad4d5eb4fc6751eab0fc1dd0bff1.png"></p>    <p>( 1 )用户端是浏览器 browser , APP 客户端</p>    <p>( 2 )后端入口是高可用的 nginx 集群,用于做反向代理</p>    <p>( 3 )中间核心是高可用的 web-server 集群, 研发工程师主要编码工作就是在这一层</p>    <p>( 4 )后端存储是高可用的 db 集群,数据存储在这一层</p>    <p><img src="https://simg.open-open.com/show/02fc32f36b12ef3212339508940cddc8.png"></p>    <p>更典型的, web-server 层是通过 DAO/ORM 等技术来访问数据库的。</p>    <p>可以看到,最初都是没有服务层的,此时架构会碰到一些什么痛点呢?</p>    <p>【架构痛点一:代码到处拷贝】</p>    <p>举一个最常见的业务的例子 -> 用户数据的访问,绝大部分公司都有一个数据库存储用户数据,各个业务都有访问用户数据的需求:</p>    <p><img src="https://simg.open-open.com/show/9279461823296fffa5093a3cf904b625.png"></p>    <p>在有用户服务之前, 各个业务线都是自己通过 DAO 写 SQL 访问 user 库来存取用户数据,这无形中就导致了代码的拷贝 。</p>    <p>【架构痛点二:复杂性扩散】</p>    <p>随着并发量的越来越高,用户数据的访问数据库成了瓶颈,需要加入缓存来降低数据库的读压力,于是架构中引入了缓存,由于没有统一的服务层, 各个业务线都需要关注缓存的引入导致的复杂性 :</p>    <p><img src="https://simg.open-open.com/show/e0b636dc68b19c1fc3e04ccaaa7afdfb.png"></p>    <p>对于用户数据的写请求,所有业务线都要升级代码:</p>    <p>( 1 )先淘汰 cache</p>    <p>( 2 )再写数据</p>    <p>对于用户数据的读请求,所有业务线也都要升级代码:</p>    <p>( 1 )先读 cache ,命中则返回</p>    <p>( 2 )没命中则读数据库</p>    <p>( 3 )再把数据放入 cache</p>    <p>这个复杂性是典型的“业务无关”的复杂性,业务方需要被迫升级。</p>    <p>随着数据量的越来越大,数据库需要进行水平拆分,于是架构中又引入了分库分表,由于没有统一的服务层, 各个业务线都需要关注分库分表的引入导致的复杂性 :</p>    <p><img src="https://simg.open-open.com/show/1392fbff23877464b73323776c7bcc1c.png"></p>    <p>这个复杂性也是典型的“业务无关”的复杂性,业务方需要被迫升级。</p>    <p>包括 bug 的修改, 发现一个 bug ,多个地方都需要修改 。</p>    <p>【架构痛点三:库的复用与耦合】</p>    <p>服务化并不是唯一的解决上述两痛点的方法,抽象出统一的 “ 库 ” 是最先容易想到的解决:</p>    <p>( 1 )代码拷贝</p>    <p>( 2 )复杂性扩散</p>    <p>的方法。抽象出一个 user.so ,负责整个用户数据的存取,从而避免代码的拷贝。至于复杂性,也只有 user.so 这一个地方需要关注了。</p>    <p>解决了旧的问题,会引入新的问题, 库的版本维护与业务线之间代码的耦合 :</p>    <p>业务线 A 将 user.so 由版本 1 升级至版本 2 ,如果不兼容业务线 B 的代码,会导致 B 业务出现问题;</p>    <p>业务线 A 如果通知了业务线 B 升级,则是的业务线 B 会无故做一些“自身业务无关”的升级,非常郁闷。当然,如果各个业务线都是拷贝了一份代码则不存在这个问题。</p>    <p>【架构痛点四: SQL <strong> 质量得不到保障,业务相互影响】 </strong></p>    <p>业务线通过 DAO 访问数据库:</p>    <p><img src="https://simg.open-open.com/show/1995e79b48cd67672f103beca8241f1e.png"></p>    <p>本质上 SQL 语句还是各个业务线拼装的,资深的工程师写出高质量的 SQL 没啥问题,经验没有这么丰富的工程师可能会写出一些低效的 SQL , 假如业务线 A 写了一个全表扫描的 SQL ,导致数据库的 CPU100% ,影响的不只是一个业务线,而是所有的业务线都会受影响 。</p>    <p>【架构痛点五:疯狂的 DB <strong> 耦合】 </strong></p>    <p>业务线不至访问 user 数据,还会结合自己的业务访问自己的数据:</p>    <p><img src="https://simg.open-open.com/show/4b28d78185f5a81971cd975275bc579c.png"></p>    <p>典型的,通过 join 数据表来实现各自业务线的一些业务逻辑。</p>    <p>这样的话,业务线 A 的 table-user 与 table-A 耦合在了一起,业务线 B 的 table-user 与 table-B 耦合在了一起,业务线 C 的 table-user 与 table-C 耦合在了一起,结果就是: table-user , table-A , table-B , table-C 都耦合在了一起。</p>    <p>随着数据量的越来越大,业务线 ABC 的数据库是无法垂直拆分开的 ,必须使用一个大库(疯了,一个大库 300 多个业务表 =_= )。</p>    <p>【架构痛点六: … <strong> 】 </strong></p>    <h2><strong>二、服务化解决什么问题? </strong></h2>    <p>为了解决上面的诸多问题,互联网高可用分层架构演进的过程中,引入了“服务层”。</p>    <p><img src="https://simg.open-open.com/show/ba444c7129c1a84b784aeb4f1adb9356.jpg"></p>    <p>以上文中的用户业务为例,引入了 user-service ,对业务线响应所用用户数据的存取。引入服务层有什么好处,解决什么问题呢?</p>    <p>【好处一:调用方爽】</p>    <p>有服务层之前:业务方访问用户数据,需要通过 DAO 拼装 SQL 访问</p>    <p>有服务层之后: 业务方通过 RPC 访问用户数据,就像调用一个本地函数一样,非常之爽</p>    <p>User = UserService::GetUserById(uid);</p>    <p>传入一个 uid ,得到一个 User 实体,就像调用本地函数一样,不需要关心序列化,网络传输,后端执行,网络传输,范序列化等复杂性。</p>    <p>【好处二:复用性,防止代码拷贝】</p>    <p>这个不展开叙述,所有 user 数据的存取,都通过 user-service 来进行,代码只此一份,不存在拷贝。</p>    <p>升级一处升级, bug 修改一处修改。</p>    <p>【好处三:专注性,屏蔽底层复杂度】</p>    <p><img src="https://simg.open-open.com/show/f64dffdb49f86752c00216faeb9c0da6.png" alt="互联网架构为什么要做服务化?" width="294" height="192"></p>    <p>在没有服务层之前,所有业务线都需要关注缓存、分库分表这些细节。</p>    <p><img src="https://simg.open-open.com/show/2a0ab43139c261106bfd87f60b82eb9e.png"></p>    <p>在有了服务层之后,只有服务层需要专注关注底层的复杂性了,向上游屏蔽了细节 。</p>    <p>【好处四: SQL <strong> 质量得到保障】 </strong></p>    <p><img src="https://simg.open-open.com/show/68a1daaf9a569a22f66c004f23a5848a.png" alt="互联网架构为什么要做服务化?" width="294" height="151"></p>    <p>原来是业务向上游直接拼接 SQL 访问数据库。</p>    <p><img src="https://simg.open-open.com/show/bf54bc722492d184f03dfb813dab78c5.png"></p>    <p>有了服务层之后,所有的 SQL 都是服务层提供的,业务线不能再为所欲为了 。底层服务对于稳定性的要求更好的话,可以由更资深的工程师维护,而不是像原来 SQL 难以收口,难以控制。</p>    <p>【好处五:数据库解耦】</p>    <p><img src="https://simg.open-open.com/show/4264dc497d4be9170dd7c7aca268f070.png" alt="互联网架构为什么要做服务化?" width="302" height="174"></p>    <p>原来各个业务的数据库都混在一个大库里,相互 join ,难以拆分。</p>    <p><img src="https://simg.open-open.com/show/a463381bf210427e25676844c3ce0a3b.png" alt="互联网架构为什么要做服务化?" width="299" height="215"></p>    <p>服务化之后, 底层的数据库被隔离开了,可以很方便的拆分出来,进行扩容 。</p>    <p>【好处六:提供有限接口,无限性能】</p>    <p>在服务化之前,各业务线上游想怎么操纵数据库都行,遇到了性能瓶颈,各业务线容易扯皮,相互推诿。</p>    <p>服务化之后, 服务只提供有限的通用接口,理论上服务集群能够提供无限性能,性能出现瓶颈,服务层一处集中优化 。</p>    <p> </p>    <p>来自:http://mp.weixin.qq.com/s?__biz=MjM5ODYxMDA5OQ==&mid=2651959519&idx=1&sn=065074b135fc9cb243abe897261e1a72&scene=0</p>    <p> </p>