分布式/云计算/大数据 - 开源经验 - 第63页

0推荐

57K 浏览

Hadoop简介：一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统...

openkk 14年前

Hadoop 分布式/云计算/大数据

0推荐

44K 浏览

hadoop hive sql语法详解

openkk 14年前

Hadoop Hive 分布式/云计算/大数据

0推荐

210K 浏览

Bigtable是一个分布式的结构化数据存储系统，它被设计用来处理海量数据：通常是分布在数千台普通服务器上的PB级的数据。Google的很多项目使用Bigtable存储数据，包括Web索引、G...

fmms 14年前

云计算分布式/云计算/大数据

0推荐

406K 浏览

我们设计并实现了Google GFS文件系统，一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。GFS虽然运行在廉价的普遍硬件设备上，但是它依然了提供灾难冗余的能力，为大量客户机提供了高性能的服务。

fmms 14年前

MapReduce 分布式/云计算/大数据

0推荐

280K 浏览

MapReduce是一个编程模型，也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合，输出中间的基于key/valu...

fmms 14年前

MapReduce 分布式/云计算/大数据

0推荐

129K 浏览

HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

fmms 14年前

HBase 分布式/云计算/大数据

0推荐

151K 浏览

Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以...

fmms 14年前

Hadoop 分布式/云计算/大数据

0推荐

29K 浏览

HBase集群搭建

fmms 14年前

HBase 分布式/云计算/大数据

0推荐

15K 浏览

Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。

fmms 14年前

Hadoop Lucene 分布式/云计算/大数据

0推荐

121K 浏览

通常，集群里的一台机器被指定为 NameNode，另一台不同的机器被指定为JobTracker。这些机器是masters。余下的机器即作为DataNode也作为TaskTracker。

fmms 14年前

Hadoop 分布式/云计算/大数据

0推荐

180K 浏览

用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面的 hql查询.hive也即做数据仓库

jopen 14年前

Hadoop 分布式/云计算/大数据

0推荐

33K 浏览

在未出现开源搜索引擎以前, Doug Cutting整了个Lucene, 随后Yonik Seeley写了一个Solr, 在2010年 Shay Banon发布了ElasticSearch

jopen 14年前

分布式分布式/云计算/大数据

0推荐

122K 浏览

Storm是Twitter开源的一个类似于Hadoop的实时数据处理框架（原来是由BackType开发，后BackType被Twitter收购，将Storm作为Twitter的实时数据分析）。

fmms 14年前

Storm 分布式/云计算/大数据

0推荐

46K 浏览

S4(Simple Scalable Streaming System)是一个分布式流处理引擎，开发者可以在这个引擎基础上开发面向无界的，不间断的流数据处理应用。

jopen 14年前

分布式分布式/云计算/大数据

0推荐

65K 浏览

Curator是Netflix开源的一套ZooKeeper客户端框架. Netflix在使用ZooKeeper的过程中发现ZooKeeper自带的客户端太底层, 应用方在使用的时候需要自己处理很...

fmms 14年前

ZooKeeper 分布式/云计算/大数据

0推荐

32K 浏览

KosmosFS像Hadoop HDFS一样，是google GFS的开源实现，不过KFS是C++语言写成，目前只支持linux和solaris系统。由于使用了C++开发，所以必然比HDFS在性...

fmms 14年前

分布式分布式/云计算/大数据

0推荐

25K 浏览

在Google的BigTable体系中，tablet的存储地址通过3层目录结构来定位的，如图所示：

fmms 14年前

HBase 分布式/云计算/大数据

0推荐

30K 浏览

Scribe日志收集服务器只负责收集主动写入它的日志，它本身不会去主动抓取某一个日志，所以为了把日志写入到 scribe服务器，我们必须主动向scribe服务器发送日志信息。由于scribe服务...

jopen 14年前

分布式日志分布式/云计算/大数据 scribe

0推荐

26K 浏览

scribe结构及源码详细分析

jopen 14年前

分布式/云计算/大数据 scribe 分布式日志

0推荐

43K 浏览

Scribe是facebook开源的日志收集系统，在facebook内部已经得到大量的应用。 Scribe是基于一个使用非阻断C++服务器的thrift服务的实现。它能够从各种日志源上收集日志，...

jopen 14年前

分布式日志分布式/云计算/大数据 scribe

Hadoop HDFS分布式文件系统设计要点与架构

hadoop hive sql语法详解

谷歌三大核心技术（三）Google_BigTable中文版

谷歌三大核心技术（一）Google File System中文版

谷歌三大核心技术（二）Google MapReduce中文版

HBase技术详细介绍

Hadoop 实战实例

HBase集群搭建

分布式存储系统 Katta

Hadoop 集群配置（最全面）

Hadoop Hive与Hbase整合

Sensei:分布式, 实时, 半结构化数据库

Twitter Storm 实时数据处理框架分析总结

Yahoo!S4分布式流处理引擎分析总结

Zookeeper开源客户端框架Curator简介

C++实现的GFS--分布式文件系统KosmosFS的编译和简单部署

HBase之功能细节

分布式日志收集系统： Facebook Scribe之日志收集方案

分布式日志收集系统： Facebook Scribe之结构及源码分析

分布式日志收集系统：Facebook Scribe

热门问答

热门文档