• Docker容器监控系统初探

     发表于 1 周 前

    随着线上服务的全面docker化,对docker容器的监控就很重要了。SA的监控系统是物理机的监控,在一个物理机跑多个容器的情况下,我们是没法从一个监控图表里面区分各个容器的资源占...

  • 关于CarbonData+Spark SQL的一些应用实践和调优经验分享

     发表于 1 周 前

    大数据时代,中大型企业数据的爆发式增长,几乎每天都能产生约 100GB 到 10TB 的数据。而企业数据分系统构建与扩张,导致不同应用场景下大数据冗余严重。行业亟需一个高效、统一的...

  • 关于负载均衡和服务发现,Google的经验在这里

     发表于 1 周 前

    今天主要分享三个议题,首先是Google数据中心的简单介绍——Google数据中心约有200万台X86PC服务,没有买任何大、小型机,完全使用廉价的PC服务器搭建,因规模庞大,所以...

  • 基于Mesos/Docker构建数据处理平台

     发表于 2 周 前

    本文深入介绍了去哪儿网利用Mesos和Docker构建私有云服务的全过程,分享了从无状态应用向有状态应用逐步过度的经验与心得。...

  • Docker 容器健康检查机制

     发表于 3 周 前

    在分布式系统中,经常需要利用健康检查机制来检查服务的可用性,防止其他服务调用时出现异常。自 1.12 版本之后,Docker 引入了原生的健康检查实现。本文将介绍Docker容器...

  • 腾讯云海量社交网络业务下的DevOps架构应用实践

     发表于 3 周 前

    在DevOps的理念中,企业的IT价值链流转的速度越快,意味着企业的互联网产品的交付能力越强,这也意味着在同行业的竞争中,企业凭借IT能力的优势,能够收获更大的竞争优势。也因此,D...

  • docker 容器基础技术:linux cgroup 简介

     发表于 1 个月 前

    Linux cgroups 的全称是 Linux Control Groups,它是 Linux 内核的特性,主要作用是 限制、记录和隔离进程组(process groups)使用...

  • HBase原理 – 所有Region切分的细节都在这里了

     发表于 1 个月 前

    Region自动切分是HBase能够拥有良好扩张性的最重要因素之一,也必然是所有分布式系统追求无限扩展性的一副良药。HBase系统中Region自动切分是如何实现的?这里面涉及很多...

  • 图解4种git合并分支方法

     发表于 1 个月 前

    有时候我们会后悔,有时候我们会想回到过去,有时候我们想改变历史,然而在我们这个世界,目前来看是无法回到过去改变历史的,但在git的世界里,一切皆有可能,我们可以在多维空间里任意切换...

  • 浅析 Bigtable 和 LevelDB 的实现

     发表于 1 个月 前

    在 2006 年的 OSDI 上,Google 发布了名为 Bigtable: A Distributed Storage System for Structured Data 的...

  • nginx 中的线程池使得性能提升 9 倍

     发表于 1 个月 前

    众所周知,Nginx 使用 异步, 事件驱动来接收连接 。这就意味着对于每个请求不会新建一个专用的进程或者线程(就像传统服务端架构一样),它是在一个工作进程中接收多个连接和请求。为...

  • 云端的SRE发展与实践

     发表于 1 个月 前

    美团点评作为综合性多业务的互联网+生活服务平台,覆盖“吃住行游购娱”各个领域,SRE就会面临一些特殊的挑战。...

  • 使用 docker 对容器资源进行限制

     发表于 1 个月 前

    在使用 docker 运行容器时,一台主机上可能会运行几百个容器,这些容器虽然互相隔离,但是底层却使用着相同的 CPU、内存和磁盘资源。如果不对容器使用的资源进行限制,那么容器之间...

  • 正确认识Docker、Kubernetes 、Apache Mesos

     发表于 1 个月 前

    无数的文章、社交媒体在探讨Docker、Kubernetes、Mesos三者之间孰优孰劣。如果你听信了某些一知半解者的言论,你可能会认为这三个开源项目正在为争夺容器霸权而殊死战斗。...

  • RabbitMQ入门与使用篇

     发表于 1 个月 前

    RabbitMQ是一个由erlang开发的基于AMQP(Advanced Message Queue)协议的开源实现。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方...

  • 深入浅出时序数据库之分布式计算

     发表于 1 个月 前

    物联网领域近期如火如荼,互联网和传统公司争相布局物联网。作为物联网领域数据存储的首选,时序数据库也越来越多进入人们的视野,而早在2016年7月,百度云在其天工物联网平台上发布了国内...

  • 9个最佳的大数据处理编程语言

     发表于 2 个月 前

    大数据的浪潮仍在继续。它渗透到了几乎所有的行业,信息像洪水一样地席卷企业,使得软件越发庞然大物,比如Excel看上去就变得越来越笨拙。数据处理不再无足轻重,并且对精密分析和强大又实...

  • 深入理解Hystrix之文档翻译

     发表于 2 个月 前

    在分布式系统中,服务与服务之间依赖错综复杂,一种不可避免的情况就是某些服务将会出现失败。Hystrix是一个库,它提供了服务与服务之间的容错功能,主要体现在延迟容错和容错,从而做到...

  • 浅谈分布式服务协调技术 Zookeeper

     发表于 2 个月 前

    Google的三篇论文影响了很多很多人,也影响了很多很多系统。这三篇论文一直是分布式领域传阅的经典。根据MapReduce,于是我们有了Hadoop;根据GFS,于是我们有了HDF...

  • 如何做到“恰好一次”地传递数十亿条消息

     发表于 2 个月 前

    在分布式领域中存在着三种类型的消息投递语义,分别是:最多一次(at-most-once)、至少一次(at-least-once)和恰好一次(exactly-once)。本文作者介绍...