登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
分布式/云计算/大数据
(共
1277
篇经验)
0
推荐
57K
浏览
Hadoop HDFS分布式文件系统设计要点与架构
Hadoop简介:一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统...
openkk
13年前
Hadoop
分布式/云计算/大数据
0
推荐
44K
浏览
hadoop hive sql语法详解
hadoop hive sql语法详解
openkk
14年前
Hadoop
Hive
分布式/云计算/大数据
0
推荐
210K
浏览
谷歌三大核心技术(三)Google_BigTable中文版
Bigtable是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的PB级的数据。Google的很 多项目使用Bigtable存储数据,包括Web索引、G...
fmms
14年前
云计算
分布式/云计算/大数据
0
推荐
406K
浏览
谷歌三大核心技术(一)Google File System中文版
我们设计并实现了Google GFS文件系统,一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。GFS虽然运行在廉价的普遍硬件设备上,但是它依然了提供灾难冗余的能力,为大量客户机提供了高性能的服务。
fmms
14年前
MapReduce
分布式/云计算/大数据
0
推荐
280K
浏览
谷歌三大核心技术(二)Google MapReduce中文版
MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合,输出中间的基于key/valu...
fmms
14年前
MapReduce
分布式/云计算/大数据
0
推荐
129K
浏览
HBase技术详细介绍
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
fmms
14年前
HBase
分布式/云计算/大数据
0
推荐
151K
浏览
Hadoop 实战实例
Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以...
fmms
14年前
Hadoop
分布式/云计算/大数据
0
推荐
29K
浏览
HBase集群搭建
HBase集群搭建
fmms
14年前
HBase
分布式/云计算/大数据
0
推荐
15K
浏览
分布式存储系统 Katta
Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。
fmms
14年前
Hadoop
Lucene
分布式/云计算/大数据
0
推荐
121K
浏览
Hadoop 集群配置(最全面)
通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker。这些机器是masters。余下的机器即作为DataNode也作为TaskTracker。
fmms
14年前
Hadoop
分布式/云计算/大数据
0
推荐
180K
浏览
Hadoop Hive与Hbase整合
用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库
jopen
14年前
Hadoop
分布式/云计算/大数据
0
推荐
33K
浏览
Sensei:分布式, 实时, 半结构化数据库
在未出现开源搜索引擎以前, Doug Cutting整了个Lucene, 随后Yonik Seeley写了一个Solr, 在2010年 Shay Banon发布了ElasticSearch
jopen
14年前
分布式
分布式/云计算/大数据
0
推荐
122K
浏览
Twitter Storm 实时数据处理框架分析总结
Storm是Twitter开源的一个类似于Hadoop的实时数据处理框架(原来是由BackType开发,后BackType被Twitter收购,将Storm作为Twitter的实时数据分析)。
fmms
14年前
Storm
分布式/云计算/大数据
0
推荐
46K
浏览
Yahoo!S4分布式流处理引擎分析总结
S4(Simple Scalable Streaming System)是一个分布式流处理引擎,开发者可以在这个引擎基础上开发面向无界的,不间断的流数据处理应用。
jopen
14年前
分布式
分布式/云计算/大数据
0
推荐
65K
浏览
Zookeeper开源客户端框架Curator简介
Curator是Netflix开源的一套ZooKeeper客户端框架. Netflix在使用ZooKeeper的过程中发现ZooKeeper自带的客户端太底层, 应用方在使用的时候需要自己处理很...
fmms
14年前
ZooKeeper
分布式/云计算/大数据
0
推荐
32K
浏览
C++实现的GFS--分布式文件系统KosmosFS的编译和简单部署
KosmosFS像Hadoop HDFS一样,是google GFS的开源实现,不过KFS是C++语言写成,目前只支持linux和solaris系统。由于使用了C++开发,所以必然比HDFS在性...
fmms
14年前
分布式
分布式/云计算/大数据
0
推荐
25K
浏览
HBase之功能细节
在Google的BigTable体系中,tablet的存储地址通过3层目录结构来定位的,如图所示:
fmms
14年前
HBase
分布式/云计算/大数据
0
推荐
30K
浏览
分布式日志收集系统: Facebook Scribe之日志收集方案
Scribe日志收集服务器只负责收集主动写入它的日志,它本身不会去主动抓取某一个日志,所以为了把日志写入到 scribe服务器,我们必须主动向scribe服务器发送日志信息。由于scribe服务...
jopen
14年前
分布式
日志
分布式/云计算/大数据
scribe
0
推荐
26K
浏览
分布式日志收集系统: Facebook Scribe之结构及源码分析
scribe结构及源码详细分析
jopen
14年前
分布式/云计算/大数据
scribe
分布式日志
0
推荐
43K
浏览
分布式日志收集系统:Facebook Scribe
Scribe是facebook开源的日志收集系统,在facebook内部已经得到大量的应用。 Scribe是基于一个使用非阻断C++服务器的thrift服务的实现。它能够从各种日志源上收集日志,...
jopen
14年前
分布式
日志
分布式/云计算/大数据
scribe
1
2
3
4
5
6
7
8
9
10
经验分享,提升职场影响力
投稿
热门问答
热门文档