0推荐
57K 浏览

Hadoop HDFS分布式文件系统设计要点与架构

Hadoop简介:一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统...
0推荐
44K 浏览

hadoop hive sql语法详解

hadoop hive sql语法详解
0推荐
210K 浏览

谷歌三大核心技术(三)Google_BigTable中文版

Bigtable是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的PB级的数据。Google的很 多项目使用Bigtable存储数据,包括Web索引、G...
0推荐
406K 浏览

谷歌三大核心技术(一)Google File System中文版

我们设计并实现了Google GFS文件系统,一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。GFS虽然运行在廉价的普遍硬件设备上,但是它依然了提供灾难冗余的能力,为大量客户机提供了高性能的服务。
0推荐
280K 浏览

谷歌三大核心技术(二)Google MapReduce中文版

MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合,输出中间的基于key/valu...
0推荐
129K 浏览

HBase技术详细介绍

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
0推荐
151K 浏览

Hadoop 实战实例

Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以...
0推荐
29K 浏览

HBase集群搭建

HBase集群搭建
0推荐
15K 浏览

分布式存储系统 Katta

Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。
0推荐
121K 浏览

Hadoop 集群配置(最全面)

通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker。这些机器是masters。余下的机器即作为DataNode也作为TaskTracker。
0推荐
180K 浏览

Hadoop Hive与Hbase整合

用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库
0推荐
33K 浏览

Sensei:分布式, 实时, 半结构化数据库

在未出现开源搜索引擎以前, Doug Cutting整了个Lucene, 随后Yonik Seeley写了一个Solr, 在2010年 Shay Banon发布了ElasticSearch
0推荐
122K 浏览

Twitter Storm 实时数据处理框架分析总结

Storm是Twitter开源的一个类似于Hadoop的实时数据处理框架(原来是由BackType开发,后BackType被Twitter收购,将Storm作为Twitter的实时数据分析)。
0推荐
46K 浏览

Yahoo!S4分布式流处理引擎分析总结

S4(Simple Scalable Streaming System)是一个分布式流处理引擎,开发者可以在这个引擎基础上开发面向无界的,不间断的流数据处理应用。
0推荐
65K 浏览

Zookeeper开源客户端框架Curator简介

Curator是Netflix开源的一套ZooKeeper客户端框架. Netflix在使用ZooKeeper的过程中发现ZooKeeper自带的客户端太底层, 应用方在使用的时候需要自己处理很...
0推荐
32K 浏览

C++实现的GFS--分布式文件系统KosmosFS的编译和简单部署

KosmosFS像Hadoop HDFS一样,是google GFS的开源实现,不过KFS是C++语言写成,目前只支持linux和solaris系统。由于使用了C++开发,所以必然比HDFS在性...
0推荐
25K 浏览

HBase之功能细节

在Google的BigTable体系中,tablet的存储地址通过3层目录结构来定位的,如图所示:
0推荐
30K 浏览

分布式日志收集系统: Facebook Scribe之日志收集方案

Scribe日志收集服务器只负责收集主动写入它的日志,它本身不会去主动抓取某一个日志,所以为了把日志写入到 scribe服务器,我们必须主动向scribe服务器发送日志信息。由于scribe服务...
0推荐
43K 浏览

分布式日志收集系统:Facebook Scribe

Scribe是facebook开源的日志收集系统,在facebook内部已经得到大量的应用。 Scribe是基于一个使用非阻断C++服务器的thrift服务的实现。它能够从各种日志源上收集日志,...
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档