构建高并发高可用的电商平台架构大纲 经验

是一种非常简洁快速的数据结构,他能同时使存储空间和速度最优化(而不必空间换时间),适合于海量数据的的计算场景。 2. 并行与分布式计算 1) 任务切分、分而治之 (MR) 在大规模的数据中,数据存在一定的局部性的特征,利用局部性的原理将海量数据计算的问题分而治之。

yne7 2015-03-30   82411   0

构建高并发高可用的电商平台架构大纲 经验

是一种非常简洁快速的数据结构,他能同时使存储空间和速度最优化(而不必空间换时间),适合于海量数据的的计算场景。 2. 并行与分布式计算 1) 任务切分、分而治之 (MR) 在大规模的数据中,数据存在一定的局部性的特征,利用局部性的原理将海量数据计算的问题分而治之。

jopen 2015-11-15   65006   0
P36

  构建高并发高可用的电商平台架构实践 文档

速度最优化(而不必空间换时间),适合于海量数据的的计算场景。 2.     并行与分布式计算   1)      任务切分、分而治之(MR) 在大规模的数据中,数据存在一定的局部性的特征,利用局部性的原理将海量数据计算的问题分而治之。

gwpking 2016-04-15   835   0

构建高并发高可用的电商平台架构大纲 经验

是一种非常简洁快速的数据结构,他能同时使存储空间和速度最优化(而不必空间换时间),适合于海量数据的的计算场景。 2. 并行与分布式计算 1) 任务切分、分而治之 (MR) 在大规模的数据中,数据存在一定的局部性的特征,利用局部性的原理将海量数据计算的问题分而治之。

dwd4 2015-03-31   73469   0
P16

  Hadoop 源码的入门解析 文档

Hadoop原来是Apache Lucene下的一个子项目,它最初是从Nutch项目中分离出来的专门负责分布式存储以及分布式运算的项目。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。下面列举hadoop主要的一些特点:

sweetbaybe 2012-12-27   2723   0

浅谈开源大数据平台的演变 经验

的 开 山鼻祖Hadoop,它是GFS和MapReduce的开源实现。 虽然在此之前有很多类似的分布式存储和计算平台,但真正能实现工业级应用、降低使用门槛、带动业界大规模部署的就是Hadoop。得益于

b77m 2015-04-22   37643   0
P23

  Hudson 持续集成测试白皮书1.0 文档

Hudson 是一个可扩展的持续集成引擎。主要用于:持续、自动地构建/测试软件项目.监控一些定时执行的任务。 Hudson拥有的特性包括: 1) 易于安装-只要把hudson.war部署到servlet容器,不需要数据库支持。

blue_kite 2012-11-24   513   0
P26

  第02章 工作流管理系统实现 文档

Enactment Service) 解释业务流程的描述、控制流程实例的运行、调度业务活动、向用户任务表添加任务并在必要的时候调用应用程序工具。 4 5. 工作流相关数据和应用数据(Workflow Relevant

accpasd 2012-08-01   3826   0

Hadoop 新 MapReduce 框架 Yarn 详解 经验

Hadoop MapReduce 框架的问题 对于业界的大数据存储及分布式处理系统来说,Hadoop 是耳熟能详的卓越开源分布式文件存储及处理框架,对于 Hadoop 框架的介绍在此不再累述,读者可参考

jopen 2014-05-14   171737   0

Hadoop MapReduceV2(Yarn) 框架 经验

Hadoop MapReduce 框架的问题 对于业界的大数据存储及分布式处理系统来说,Hadoop 是耳熟能详的卓越开源分布式文件存储及处理框架,对于 Hadoop 框架的介绍在此不再累述,读者可参考

jopen 2014-09-11   22474   0
P19

  MapReduce超大集群的简单数据处理 文档

e对,并且使用reduce函数来合并所有的具有相同key值的中间键值对中的值部分。现实生活中的很多任务的实现都是基于这个模式的,正如本文稍后会讲述的那样。 使用这样的函数形式实现的程序可以自动分布到一

hadoopfans 2010-11-20   5288   0
P19

  MapReduce超大集群的简单数据处理 文档

e对,并且使用reduce函数来合并所有的具有相同key值的中间键值对中的值部分。现实生活中的很多任务的实现都是基于这个模式的,正如本文稍后会讲述的那样。 使用这样的函数形式实现的程序可以自动分布到一

f0xf0x 2013-11-21   2001   0

ticketea如何从一体化转向多体化架构 资讯

在Odin之后,我们又开发了一个后台任务执行系统Heracles,它依赖于一个RabbitMQ集群,在当时采用了Python Celery实现。我们废弃了之前自行开发的一个Ruby任务系统,它已经无法满足今后的工作需要处理的任务数量与粒度的需求了。

jopen 2016-03-11   8458   0

RocketMQ与Kafka对比 经验

er,向业务返回成功,此时Producer宕机,会导致消息丢失,业务出错 Producer通常为分布式系统,且每台机器都是多线程发送,我们认为线上的系统单个Producer每秒产生的数据量有限,不可能上万。

BarCorbitt 2016-02-29   20271   0

开源的DevOps开发工具箱 经验

站服务运行状态信息; Ganglia :Ganglia 是一个跨平台可扩展的、高性能计算系统下的分布式监控系统,如集群和网格; Server Density :一个跨平台的监控系统; Folsom :Folsom

jopen 2014-12-09   46194   0
DevOps  
P17

  高并发应用性能优化与实践交流 文档

tolerance(分区容错性) ,可靠性。 定理:任何分布式系统只可同时满足二点,没法三者兼顾。 忠告:架构设计时,不要将精力浪费在如何设计能满足三者的完美分布式系统,而是应该进行取舍。 2.1 设计理论——CAP理论

wang_wf 2013-05-07   3173   0

问诊12306之二:系统不开放 3亿投资恐打水漂 资讯

会采用分布式数据处理的技术手段,12306显然存在一定的技术和架构方面的缺陷。对于如何解决上述问题相关人士也给出了综合治理的解决方案: 1、 对 12306 进行相应的技术升级,并通过分布式数据处理等技术手段不断改进和优化

jopen 2012-09-27   7313   0
12306  

0x0F 大数据职位,数据场技能(下) 经验

,比如常用的Web服务器引擎Nginx及其产生的日志,常用的文件传输scp或者rsync,常用的定时任务crontab等等这些工具,稳定又实用。 2.3 Python或者R语言生态 掌握一门分析专

ersm3365 2016-01-29   41293   0

Netty可靠性分析 经验

com、亚马逊移动端以及Amazon.ca等网站进行购物。 1.2. 软件可靠性 软件可靠性是指在给定时间内,特定环境下软件无错运行的概率。软件可靠性包含了以下三个要素: 1) 规定的时间:软件可靠

liuxie0915 2017-01-20   79180   0
P27

  实时数据平台技术实践(v4) 文档

据仓库解决方案 弊端 高复杂度计算任务并发性差 海量数据处理能力不足 存储能力有限 扩展性差 成本高 后期遇到的问题 越来越多的ETL任务需要12点后才能完成 任务排队现象严重 基于流量等大数据量的批量计算和复杂推荐类算法基本无法应付

cpp45 2015-01-18   2782   0
1 2 3 4 5 6 7 8 9 10