开源项目,开源代码,开源文档,开源新闻,开源社区

P119

通道的。 3、选择器选择器是NIO第三个创新，它提供了可以选择已经就绪任务的能力，通过epool回调的方式获取已经就绪的任务，实现多路I/O复用。 Jetty中的NIO体系结构上文中出现的各种Co

lizhi_java 2017-01-05 1291 0

Jetty 应用服务器方案 Apache HTTP

P19

考虑各个ETL任务在各台物理主机上的分布。 ² 需要提供一个监控统计模块对ETL的整个过程进行有效的监控和统计，提供GUI界面对ETL各个任务的处理情况进行统计和监控，例如每个ETL任务的状态、处理记

ytoms 2013-02-27 406 0

P21

短短几年就产生巨大的影响力，不亚于IT业中的又一场革命。云计算是并行计算（Parallel Computing）、分布式计算（Distributed Computing）和网格计算（Grid Computing）的发

orangeking 2012-06-29 765 0

分布式/云计算/大数据 Go

工具直观展现，因为 HIVE 太慢或者 ODBC 还不可用。 Presto 是由facebook开发的一个分布式SQL查询引擎，它被设计为用来专门进行高速、实时的数据分析。它支持标准的ANSI SQL，包括复

jopen 2015-11-21 19768 0

PrestoDB

P42

Cassandra是一个混合型的非关系的数据库，类似于Google的BigTable。其主要功能比Dynomite（分布式的Key-Value存储系统）更丰富，但支持度却不如文档存储MongoDB（介于关系数据库和非关系

css0613 2011-05-13 6970 0

Cassandra 分布式/云计算/大数据方案 Java Go

❷优化了Hive请求执行计划，优化后请求时间减少90%。改动了Hive执行引擎，增加单Hive任务的被秒处理记录数。 ❸在Hive社区中引入了新的列式文件格式（如ORC文件），提供一种更现代、高效和高性能的方式来储存Hive数据。

jopen 2016-01-05 78569 0

分布式/云计算/大数据

P16

线程等不同主机的实现，形成统一的接口。如java,ACE b) 分布式中间件：连接管理，内存管理，整编，解编，端点和请求的多路分离，同步，多线程等，使程序员象开发独立应用程序一样开发分布式应用程序。分布式中间件的核心是ORB(Object

openanran 2013-01-15 2662 0

网络工具包 C/C++

这样的号来存储，而我微博里讨论的时候也都是以发号器为标签。它的主要目的确如平常大家理解的“为一个分布式系统的数据object产生一个唯一的标识”，但其实在一个真实的系统里可能也可以承担更多的作用。概括起来主要有以下几点：

jopen 2015-01-18 23567 0

生成器

异步编程提供了一个非阻塞的，事件驱动的编程模型。这种编程模型利用系统中多核执行任务来提供并行，因此提供了应用的吞吐率。此处吞吐率是指在单位时间内所做任务的数量。在这种编程方式下，一个工作单元将独立于主应用线程而执行，

jopen 2015-03-24 22656 0

Java Java开发

据量较大，只不过这些数据输入到的不是电脑，而是人脑并最终通过计算分析得出结论。 Google分布式计算的三驾马车 Google File System用来解决数据存储的问题，采用N多台廉价的电脑，

jopen 2014-12-12 66149 0

大数据分布式/云计算/大数据

据量较大，只不过这些数据输入到的不是电脑，而是人脑并最终通过计算分析得出结论。 Google分布式计算的三驾马车 Google File System用来解决数据存储的问题，采用N多台廉价的电脑，

jopen 2015-03-11 33285 0

大数据分布式/云计算/大数据

出现了更先进的工程和运维技术及技巧。 Little说：“区别就在于，推动它的主要是开发软件和分布式软件领域的新方法。Linux容器等技术――Docker就是个典例。你现在有了不变的服务，有了Ku

jopen 2015-07-17 10682 0

微服务

P18

且数据量较大，只不过这些数据输入到的不是电脑，而是人脑并最终通过计算分析得出结论。 Google分布式计算的三驾马车 · Google File System用来解决数据存储的问题，采用N多台廉价的电

guet_lee 2017-01-12 1828 0

分布式/云计算/大数据方案 SQL Go

P36

大数据开放平台的门户Maple-BDWS 14. 大数据工作站-Maple-BDWS功能代码托管编译部署工作流设计任务调度数据&任务信息浏览特点多个集群管理多版本集群兼容支持多项目管理在线编译部署（One button

w327 2015-05-25 779 0

Hadoop 分布式/云计算/大数据方案 Apache Java

P36

大数据开放平台的门户Maple-BDWS 14. 大数据工作站-Maple-BDWS功能代码托管编译部署工作流设计任务调度数据&任务信息浏览特点多个集群管理多版本集群兼容支持多项目管理在线编译部署（One button

ee37 2015-07-05 501 0

Hadoop 分布式/云计算/大数据

P9

Petabyte，2的50次方个字节。这个对很多人还是很陌生的计量单位，已经变得越来越普遍和触手可及。2004年8月，GOOGLE日常任务输入的数据已经达到了3PB ；2005年Mark Hurd从Teradata来到HP出任CEO，开始建设基于Neo

videostorm 2013-10-26 485 0

分布式/云计算/大数据

Pholcus（幽灵蛛）是一款纯Go语言编写的高并发、分布式、重量级爬虫软件，支持单机、服务端、客户端三种运行模式，拥有Web、GUI、命令行三种操作界面；规则简单灵活、批量任务并发、输出方式丰富（mysql/mon

jopen 2016-03-03 6066 0

MySQL Go语言分布式系统

P4

高效稳定 分布式高速采集系统，多个大型服务端同时稳定运作，快速分解任务量，最大化提升效率。数据精准内置采集监控系统，实时报错及时修复；采集发布时确保数据零遗漏，为用户呈现最精准的数据。 分布式高速采集

ycxdr01 2016-09-24 2130 0

P9

task的ID。 Hadoop本身提供了几个OutputFormat: 3. 分布式缓存 Haoop中自带了一个分布式缓存，即DistributedCache对象，方便map task之间或者reduce

grid2012 2012-08-28 1979 0

分布式/云计算/大数据

P3

azkaban2提交任务介绍 azkaban2定义工作流以job文件结尾,如wordcount.job 具体可参考http://blog.csdn.net/gloria__zhang/articl

suncf1985 2014-06-26 659 0

工作流引擎

jetty源码学习文档

开放无限基于短彩技术部的数据仓库概要设计说明书－ETL概要设计分册文档

云服务平台介绍文档

Presto DB 简介经验

Cassandra讲座文档

开源大数据处理工具汇总（上）经验

C++网络编程学习笔记(ACE) 文档

业务系统需要什么样的ID生成器经验

[译] Java 异步编程最佳实践经验

深入浅出解析大数据平台架构经验

多图技术贴：深入浅出解析大数据平台架构经验

微服务架构全解析：绝不是360度无死角资讯

深入浅出解析大数据平台架构文档

以Hadoop为核心的大数据开放平台建设文档

以Hadoop为核心的大数据开放平台建设文档

一位架构师谈海量计算存储文档

Pholcus 爬虫 v0.8.2，性能提升 20% 以上资讯

火车采集器说明文档文档

MapRedue 作业过程文档

azkaban2 创建工作流文档

分布式定时任务的相关搜索

关键词

jetty源码学习 文档

开放无限基于短彩技术部的数据仓库概要设计说明书－ETL概要设计分册 文档

云服务平台介绍 文档

Presto DB 简介 经验

Cassandra讲座 文档

开源大数据处理工具汇总（上） 经验

C++网络编程学习笔记(ACE) 文档

业务系统需要什么样的ID生成器 经验

[译] Java 异步编程最佳实践 经验

深入浅出解析大数据平台架构 经验

多图技术贴：深入浅出解析大数据平台架构 经验

微服务架构全解析：绝不是360度无死角 资讯

深入浅出解析大数据平台架构 文档

以Hadoop为核心的大数据开放平台建设 文档

以Hadoop为核心的大数据开放平台建设 文档

一位架构师谈海量计算存储 文档

Pholcus 爬虫 v0.8.2，性能提升 20% 以上 资讯

火车采集器说明文档 文档

MapRedue 作业过程 文档

azkaban2 创建工作流 文档

分布式定时任务 的相关搜索

关键词

jetty源码学习文档

开放无限基于短彩技术部的数据仓库概要设计说明书－ETL概要设计分册文档

云服务平台介绍文档

Presto DB 简介经验

Cassandra讲座文档

开源大数据处理工具汇总（上）经验

业务系统需要什么样的ID生成器经验

[译] Java 异步编程最佳实践经验

深入浅出解析大数据平台架构经验

多图技术贴：深入浅出解析大数据平台架构经验

微服务架构全解析：绝不是360度无死角资讯

深入浅出解析大数据平台架构文档

以Hadoop为核心的大数据开放平台建设文档

以Hadoop为核心的大数据开放平台建设文档

一位架构师谈海量计算存储文档

Pholcus 爬虫 v0.8.2，性能提升 20% 以上资讯

火车采集器说明文档文档

MapRedue 作业过程文档

azkaban2 创建工作流文档

分布式定时任务的相关搜索