P27

  实时数据平台技术实践 文档

据仓库解决方案 弊端 高复杂度计算任务并发性差 海量数据处理能力不足 存储能力有限 扩展性差 成本高 后期遇到的问题 越来越多的ETL任务需要12点后才能完成 任务排队现象严重 基于流量等大数据量的批量计算和复杂推荐类算法基本无法应付

c6g3 2015-02-18   2289   0
P11

  Java类中热替换的概念、设计与实现 文档

class文件放在该目录中。接下来要使用我们前面编写的HotswapCL来实现 该类的热替换。具体的做法为:我们编写一个定时任务,每隔2秒钟执行一次。其中,我们会创建新的类加载器实例加载Foo类,生成实例,并调用 sayHe

javacoo 2011-05-15   3540   0
P9

  Hadoop API 使用介绍 文档

定义了抽象的文件系统API。 org.apache.hadoop.dfs       Hadoop分布式文件系统(HDFS)模块的实现。 org.apache.hadoop.io         定义了通用的I/O

whyqq1987 2012-03-19   3909   0

不同的瑞士军刀:对比 Spark 和 MapReduce 经验

Spark 可以直接从 HDFS (Hadoop Distributed File System 分布式文件系统)中读取数据。 诸如  Yahoo(雅虎)、Intel(因特尔)、Baidu(百度)、Trend

jopen 2016-01-14   21447   0

Spark 是否真的比 MapReduce 技高一筹 资讯

Spark 可以直接从 HDFS (Hadoop Distributed File System 分布式文件系统)中读取数据。 诸如 Yahoo(雅虎)、Intel(因特尔)、Baidu(百度)、Trend

jopen 2016-02-19   29104   0

架构经验系列文章 - 后端架构 - 架构层面 经验

的是灾难。当然写一个日志远远没有想的这么简单: 为了达到比较好的性能,日志是否先写本地内存队列然后定时刷到数据库中去? 各种日志混在一起也难以搜索,是否要添加一些搜索字段?比如分模块? 如果数据库不可

jopen 2014-07-27   15597   0

storm简介 经验

低延迟。都说了是实时计算系统了,延迟是一定要低的。 高性能。性能不高就是浪费机器,浪费机器是要受批评的哦。 分布式。系统都是为应用场景而生的,如果你的应用场景、你的数据和计算单机就能搞定,那么不用考虑这些复杂的问题了。我们所说的是单机搞不定的情况。

jopen 2013-11-04   78329   0

从Hadoop到Spark的架构实践 经验

HDFS。其中,排名和推荐算法的实现都采用了MapReduce,系统中只存在离线批量计算,并通过基于Azkaban的调度系统进行离线任务的调度。 第一个版本的数据中心架构基本上是以满足“最基本的数据利用”这一目的进行设计的。然而,

jopen 2015-06-08   49372   0
P3

  redis集群 文档

要的各种细节,但是客户端作者需要注意这些细节都有可能被修改。 二、什么是Redis集群   集群是独立服务器关于分布式与容错实现的一个子集。在集群之中没有中心节点与代理节点,设计的主要目的之一就是线性可伸缩的扩展(即随意增删节

pro_lv 2017-02-23   3349   0

基于Hadoop的大规模网络流量分析 经验

考 虑使用分布式的方法。而分布式计算平台Hadoop以及依托在Hadoop平台下的MapReduce框架为解决这类问题提供了良好的支撑。Hadoop 是Apache的一个子项目主要由分布式文件系HDF

jopen 2015-07-30   14958   0

迎来ThinkJS 2.1版本 性能提升90%支持TypeScript 资讯

Koa,但性能上并不比 Express 和 Koa 逊色多少,具体的测试数据请见下图。 注:以上数据使用分布式压力测试系统测试。 从上图中测试数据可以看到,虽然 ThinkJS 比 Express 和 Koa

jopen 2016-01-14   12303   0
P25

  大用户量下的系统架构 文档

Controll负责服务之间的调度 8. 8简洁的扩展因为简洁,所以容易Mysql的读写分离和分库 分布式的Memcache 多个Service的布署 多个Controller的布署 9. 9强大工欲善其事

heydaies 2014-12-11   559   0

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具 经验

一个Jvm Container对应多个instance,每个instance对应于一张表的迁移任务 instance分为三部分 a.  extractor  (从源数据库上提取数据,可分为全量/增量实现)

JaiFay 2016-03-05   48592   0
P32

  并发编程 文档

并发编程 曾丹-2011-5-23 一、OS中的并发 在多线程、多处理器甚至是分布式环境的编程时代,并发是一个不可回避的问题,很多程序员一碰到并发二字头皮就发麻,也包括我。既然并发问题摆在面前一个到

zengdan 2011-08-09   4228   0
P15

  rocketmq原理介绍 文档

宕机或者重启)下,消息短暂的乱序,使用普通顺序方式比较合适。 ▶严格顺序消息 顺序消息的一种,无论正常异常情况都能保证顺序,但是牺牲了分布式 Failover 特性,即 Broker 集群中只要有一台机器不可用,则整个集群都不可用,服务可用性大大降低。

sunshine42 2016-09-16   577   0

ORACLE JOB INTERVAL参数设置 博客

sysdate+1/1440 2:每天定时执行 例如:每天的凌晨1点执行 Interval => TRUNC(sysdate) + 1 +1/ (24) 3:每周定时执行 例如:每周一凌晨1点执行

ophoper 2011-07-10   3371   0

Apache kafka 工作原理介绍 经验

原文出处: IBM/周明耀 消息队列 消息队列技术是分布式应用间交换信息的一种技术。消息队列可驻留在内存或磁盘上, 队列存储消息直到它们被应用程序读走。通过消息队列,应用程序可独立地执

jopen 2015-08-11   22359   0

京东通天塔——京东中间件如何支撑起每一场大促 经验

从传统的电子政务行业转到互联网行业; 选择了京东,给自己一个挑战发挥的平台。 由于自己很喜欢技术,而且喜欢中间件、高并发分布式和弹性计算这三大领域本身带来的技术挑战,目前这些技术已经是公司的核心支撑系统,是京东抗大流量的关键。

AlyciaJamar 2016-11-13   94705   0
P21

  MapReduce: simplified Data Processing on Large Clusters [翻译版---大规模集群上的简化数据处理] 文档

合, 以及一个叫做reduce的函数用以合并所有先前map过后的有相同键的中间量。现实世界中的许多任务在这个模型中得到了很好的表达,如下文所述。   程序员用这种风格的程序写出的代码可以自动并行以及在

76974930 2014-07-14   541   0

淘宝开放平台技术历程 经验

能够有足够强的缓存,Memcached无疑是最好的选择,但当时号称分布式缓存的 Memcached其实是集中式缓存的一种,真正的分布式缓存都还在纠结于一致性和效率的问题(2, 3阶段提交)。此时需要有

jopen 2012-10-14   98746   0
1 2 3 4 5 6 7 8 9 10