P119

  jetty源码学习 文档

通道的。 3、选择器 选择器是NIO第三个创新,它提供了可以选择已经就绪任务的能力,通过epool回调的方式获取已经就绪的任务,实现多路I/O复用。 Jetty中的NIO体系结构 上文中出现的各种Co

lizhi_java 2017-01-05   1291   0
P19

  开放无限基于短彩技术部的数据仓库概要设计说明书-ETL概要设计分册 文档

考虑各个ETL任务在各台物理主机上的分布。 ² 需要提供一个监控统计模块对ETL的整个过程进行有效的监控和统计,提供GUI界面对ETL各个任务的处理情况进行统计和监控,例如每个ETL任务的状态、处理记

ytoms 2013-02-27   406   0
P21

  云服务平台介绍 文档

短短几年就产生巨大的影响力,不亚于IT业中的又一场革命。 云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing) 和网格计算(Grid Computing)的发

orangeking 2012-06-29   765   0

Presto DB 简介 经验

工具直观展现,因为 HIVE 太慢或者 ODBC 还不可用。 Presto 是由facebook开发的一个分布式SQL查询引擎, 它被设计为用来专门进行高速、实时的数据分析。它支持标准的ANSI SQL,包括复

jopen 2015-11-21   19768   0
P42

  Cassandra讲座 文档

Cassandra是一个混合型的非关系的数据库,类似于Google的BigTable。其主要功能比Dynomite(分布式的Key-Value存储系统)更丰富,但支持度却不如文档存储MongoDB(介于关系数据库和非关系

css0613 2011-05-13   6970   0

开源大数据处理工具汇总(上) 经验

❷优化了Hive请求执行计划,优化后请求时间减少90%。改动了Hive执行引擎,增加单Hive任务的被秒处理记录数。 ❸在Hive社区中引入了新的列式文件格式(如ORC文件),提供一种更现代、高效和高性能的方式来储存Hive数据。

jopen 2016-01-05   78569   0
P16

  C++网络编程学习笔记(ACE) 文档

线程等不同主机的实现,形成统一的接口。如java,ACE b) 分布式中间件:连接管理,内存管理,整编,解编,端点和请求的多路分离,同步,多线程等,使程序员象开发独立应用程序一样开发分布式应用程序。分布式中间件的核心是ORB(Object

openanran 2013-01-15   2662   0

业务系统需要什么样的ID生成器 经验

这样的号来存储,而我微博里讨论的时候也都是以发号器为标签。它的主要目的确如平常大家理解的“为一个分布式系 统的数据object产生一个唯一的标识”,但其实在一个真实的系统里可能也可以承担更多的作用。概括起来主要有以下几点:

jopen 2015-01-18   23567   0

[译] Java 异步编程最佳实践 经验

异步编程提供了一个非阻塞的,事件驱动的编程模型。 这种编程模型利用系统中多核执行任务来提供并行,因此提供了应用的吞吐率。此处吞吐率是指在单位时间内所做任务的数量。 在这种编程方式下, 一个工作单元将独立于主应用线程而执行,

jopen 2015-03-24   22656   0

深入浅出解析大数据平台架构 经验

据量较大,只不过这些数据输入到的不是电脑,而是人脑并最终通过计算分析得出结论。 Google分布式计算的三驾马车 Google File System用来解决数据存储的问题,采用N多台廉价的电脑,

jopen 2014-12-12   66149   0

多图技术贴:深入浅出解析大数据平台架构 经验

据量较大,只不过这些数据输入到的不是电脑,而是人脑并最终通过计算分析得出结论。 Google分布式计算的三驾马车 Google File System用来解决数据存储的问题,采用N多台廉价的电脑,

jopen 2015-03-11   33285   0

微服务架构全解析:绝不是360度无死角 资讯

出现了更先进的工程和运维技术及技巧。 Little说:“区别就在于,推动它的主要是开发软件和分布式软件领域的新方法。Linux容器等技术――Docker就是个典例。你现在有了 不变的服务,有了Ku

jopen 2015-07-17   10682   0
P18

  深入浅出解析大数据平台架构 文档

且数据量较大,只不过这些数据输入到的不是电脑,而是人脑并最终通过计算分析得出结论。 Google分布式计算的三驾马车 · Google File System用来解决数据存储的问题,采用N多台廉价的电

guet_lee 2017-01-12   1828   0
P36

  以Hadoop为核心的大数据开放平台建设 文档

大数据开放平台的门户Maple-BDWS 14. 大数据工作站-Maple-BDWS功能 代码托管 编译部署 工作流设计 任务调度 数据&任务信息浏览 特点 多个集群管理 多版本集群兼容 支持多项目管理 在线编译部署(One button

w327 2015-05-25   779   0
P36

  以Hadoop为核心的大数据开放平台建设 文档

大数据开放平台的门户Maple-BDWS 14. 大数据工作站-Maple-BDWS功能 代码托管 编译部署 工作流设计 任务调度 数据&任务信息浏览 特点 多个集群管理 多版本集群兼容 支持多项目管理 在线编译部署(One button

ee37 2015-07-05   501   0
P9

  一位架构师谈海量计算存储 文档

Petabyte,2的50次方个字节。这个对很多人还是很陌生的计量单位,已经变得越来越普遍和触手可及。2004年8月,GOOGLE日常任务输入的数据已经达到了3PB ;2005年Mark Hurd从Teradata来到HP出任CEO,开始建设基于Neo

videostorm 2013-10-26   485   0

Pholcus 爬虫 v0.8.2,性能提升 20% 以上 资讯

Pholcus(幽灵蛛)是一款纯Go语言编写的高并发、分布式、重量级爬虫软件,支持单机、服务端、客户端三种运行模式,拥有Web、GUI、命令行三种操作界面;规则简单灵活、批量任务并发、输出方式丰富(mysql/mon

jopen 2016-03-03   6066   0
P4

  火车采集器说明文档 文档

高效稳定 分布式高速采集系统,多个大型服务端同时稳定运作,快速分解任务量,最大化提升效率。 数据精准 内置采集监控系统,实时报错及时修复;采集发布时确保数据零遗漏,为用户呈现最精准的数据。 分布式高速采集

ycxdr01 2016-09-24   2130   0
P9

  MapRedue 作业过程 文档

task的ID。 Hadoop本身提供了几个OutputFormat: 3. 分布式缓存 Haoop中自带了一个分布式缓存,即DistributedCache对象,方便map task之间或者reduce

grid2012 2012-08-28   1979   0
P3

  azkaban2 创建工作流 文档

azkaban2提交任务 介绍 azkaban2定义工作流以job文件结尾,如wordcount.job 具体可参考http://blog.csdn.net/gloria__zhang/articl

suncf1985 2014-06-26   659   0
1 2 3 4 5 6 7 8 9 10