P45

  第05章 工作流执行服务 文档

工作流执行服务的结构工作流执行服务是工作流管理系统的心脏 解释业务流程定义、创建新的流程实例 基于流程定义生成活动或任务实例 匹配任务和资源 支持活动的执行并记录流程实例运行状况 工作流执行服务的结构 4 5. 5.1.2 分离关注点逻辑上的关注点分离

accpasd 2012-08-01   2661   0

用Apache Spark进行大数据处理——第三部分:Spark流 经验

或天运行的任务。但若是在数据驱动的业务决策场景下,当需要飞快地分析实时数据流以执行分析并创建决策支持时,又该如何呢? 使用流式数据处理,一旦数据到达计算就会被实时完成,而非作为批处理任务。实时数据

hgdx4257 2016-03-02   74732   0

天猫浏览型应用的CDN静态化架构演变 经验

的静态化架构,可以满足高可用持续伸缩的原始预期,并包含如下特性。 动静分离:HTML 静态化和热点分离。 分布式缓存体系:利用 CDN 节点分布式缓存。 多级缓存机制:CDN 两级+应用一级。 统一服务静态化集群。 一致性维持:主动失效&自动失效缓存机制。

jopen 2014-01-23   28610   0

天猫浏览型应用的CDN静态化架构演变 问答

高可用持续伸缩的原始预期,并包含如下特性。 动静分离:HTML静态化和热点分离。 分布式缓存体系:利用CDN节点分布式缓存。 多级缓存机制:CDN两级+应用一级。 统一服务静态化集群。 一致性维持:主动失效&自动失效缓存机制。

miie 2014-07-10   20820   2
架构   缓存   C/C++   Go  

通过HBase Observer同步数据到ElasticSearch 经验

c-elasticsearch/ Observer希望解决的问题 众所周知,HBase是一个分布式的存储体系,数据按照RowKey分成不同的Region,再分配给RegionServer管理。但是

jopen 2015-04-25   38820   0

MapReduce论文学习笔记 经验

MapReduce框架模型:通过简单接口(用户只要实现Map和Reduce函数)实现大规模数据的分布式计算,实现在大量普通机器上的高性能计算 二、编程模型 1、例子 * 计算一个大文档

jopen 2013-12-09   33293   0

软件开发之技能梳理 经验

: 顺序计算、并发计算 (并行计算、分布式计算); 理解应用所基于的计算模型和框架是非常重要的。传统应用通常基于顺序计算,而现代商业应用,比如云计算,通常基于分布式计算架构; 大规模的科学计算应用, 比如基因序列计算,

jopen 2016-01-15   25749   0
P23

  Hadoop 介绍演示文稿 文档

3 MapReduce 2. 概要介绍1. Hadoop就是一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储 。 2. Hadoop是项

gonow86 2013-01-30   652   0

大数据环境下互联网行业数据仓库/数据平台的架构之漫谈 经验

lxw的大数据田地 ,或者 加入邮件列表 ,随时接收博客更新的通知邮件。 数据采集 数据采集层的任务就是把数据从各种数据源中采集和存储到数据存储上,期间有可能会做一些简单的清洗。 数据源的种类比较多:

jopen 2015-10-17   110870   0
数据  

浅谈开源大数据平台的演变 经验

的 开 山鼻祖Hadoop,它是GFS和MapReduce的开源实现。 虽然在此之前有很多类似的分布式存储和计算平台,但真正能实现工业级应用、降低使用门槛、带动业界大规模部署的就是Hadoop。得益于

jopen 2015-11-21   25453   0
P72

  hadoop原理与实践01_v1.0 文档

全世界多个数据中心,有些附带发电厂 运营商向Google付费Hadoop的思想之源Google22 23. 分布式架构23 24. Google面对数据和计算的难题 大量的网页怎么存储? 存储的网页怎么搜索? 哪一个网站在前面展示?24

小辉x 2016-05-16   660   0
P8

  政府数据交换平台解决方案 文档

,即使同一地区的政府机构间也无法进行合理、有效的沟通,可以说是一座座的“信息孤岛”。电子政务实施的任务之一就是要将这些“孤岛”有机地串连在一起,充分发挥其效能,同时也保护了各部门在该方面的经济投入和精

javaso 2016-07-13   4795   0
方案  
P23

  Spanner 技术分析 文档

2011(2008),支持SQL、ACID(NewSQL) Spanner/F1 2012(2009),首个全球分布式事务数据库OLAP MapReduce 2004,成为大数据分析的业界标准 Dremel 2010

kinfion 2013-04-23   3093   0
P29

  jenkins自动化集成操作指南 文档

Jenkins 是一个可扩展的持续集成引擎。 主要用于: Ø 持续、自动地构建/测试软件项目。 Ø 监控一些定时执行的任务。 Jenkins拥有的特性包括: Ø 易于安装-只要把jenkins.war部署到servlet容器,不需要数据库支持。

masterone 2016-10-03   475   0

让餐厅放心的云服务-雅座CRM技术解密 经验

主数据中心处理POS、微信、安卓终端等在线交易实时相关的业务,灾备数据中心处理CRM数据分析、定时 任务、日志分析、Storm等准实时业务,通过pgq 和流复制各数据中心保持两份完整的交易数据。当数据

jopen 2015-07-03   78266   0
CRM   ERP/CRM  
P17

  Google App Engine技术架构资料大盘点 文档

可以分为四大类: · 分布式基础设施:GFS、Chubby 和 Protocol Buffer。 · 分布式大规模数据处理:MapReduce 和 Sawzall。 · 分布式数据库技术:BigTable

fox 2012-02-02   523   0
Go  

阿里巴巴73款开源产品全向图 经验

的性能提升。在秒杀场景下,性能提升 100 倍。” OceanBase :OceanBase 是一个支持海量数据的高性能分布式数据库系统,实现了数千亿条记录、数百 TB 数据上的跨行跨表事务,由淘宝核心系统研发部、运维、DBA、广告、应用研发等部门共同完成。

ZacheryWUN 2016-11-21   11229   0
P25

  Hadoop进阶 文档

参考文献 《Hadoop权威指南前三章中文版》 《Hadoop开发者第二期发布版V3》 《Hadoop分布式文件系统架构和源码分析报告.doc》 《HDFS资料整理.doc》 2,适用场景 HDFS被调节以

7at7 2011-04-27   3440   0
P56

  中间件技术05 - 分布计算资源管理与负载均衡系统中间件 文档

连入网络的工作站时常处于空闲状态 白天30%以上空闲, 空闲工作站的含义 未请求联机 no log in 联机,但用户未操作,(规定时间内无键盘/鼠标动作,无用户启动的进程运行) 负载小于指定比例(5%)的工作站视为空闲 充分利用空闲工作站,满足有关应用需求。

zhoupu1981 2014-06-25   1820   0
方案   报告   HTTP   Scala  

携程实时用户行为系统实践 经验

Service。Collector Service将消息发送到分布式队列。数据处理模块由流计算框架完成,从分布式队列读出数据,处理之后把数据写入数据层,由分布式缓存和数据库集群组成。 输出流相对简单,web

guananfang 2017-04-13   31000   0
1 2 3 4 5 6 7 8 9 10