P45

  基于Hadoop的大数据应用分析 文档

大量计算机组成的集群中运行海量数据的分布式计算,它可以让应用程序支持上千个节点和PB级别的数据。 Hadoop是项目的总称,主要是由分布式存储(HDFS)、分布式计算(MapReduce)等组成 。 优点:

xcxc 2015-08-24   782   0

开源大数据处理工具汇总(上) 经验

是用来进行大数据查询的补充工具。 Impala 并没有取代像Hive这样基于MapReduce的分布式处理框架。Hive和其它基于MapReduce的计算框架非常适合长时间运行的批处理作业,例 如那些涉及到批量

jopen 2016-01-05   78569   0

Hadoop各个类的作用 经验

DelegationTokenRenewer.java----继承实现类:这是一个守护进程,实现等待下一个文件系统的接续; DelegationTokenSecretManager.java----继承实现

jopen 2014-02-18   63842   0
P27

  Google_Chubby_lockservice_王公仆 文档

2. Chubby设计概述设计初衷 目标:同时为弱关系分布式系统提供粗粒度锁服务与低容量可靠存储; 接口:提供类似于带有建议性锁的分布式文件系统的接口; 侧重点:设计主要侧重于可用性与可靠性而非高性能;

ng44 2013-12-25   2480   0
P6

  Hadoop入门 文档

Hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样,

ck614 2010-11-10   4010   0

夜话存储:从调侃OpenStack和Ceph谈起 经验

继续预热宣讲尚未解决元数据集群稳定性(也就是高可用)的 CephFS 文件系统;另一方面也听到 HP 内部测试了 Ceph 分布式块存储之后,认为其尚未达到商业部署要求,而在 Helion 中推荐自家的软件定义存储

jopen 2015-01-06   77300   0

Hadoop编程入门 博客

Hadoop 是Google MapReduce 的 一个Java 实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄

Hadoopp 2012-09-28   1276   0
NeoLua  
P25

  Hadoop进阶 文档

《Hadoop权威指南前三章中文版》 《Hadoop开发者第二期发布版V3》 《Hadoop分布式文件系统架构和源码分析报告.doc》 《HDFS资料整理.doc》 2,适用场景 HDFS被调节以支持

7at7 2011-04-27   3440   0

阿里巴巴73款开源产品全向图 经验

nginx-tfs :nginx-tfs 是 Nginx 的扩展模块用于访问淘宝的 TFS 文件系统。 transmittable-thread-local :transmittable-thread-local

ZacheryWUN 2016-11-21   11229   0

《Hadoop基础教程》之初识Hadoop 经验

随后在2003年Google发表了一篇技术学术论文谷歌文件系统(GFS)。GFS也就是google File System,google公司为了存储海量搜索数据而设计的专用文件系统。 2004年Nutch创始人Doug

jopen 2015-01-12   27646   0
P1

  系统设计面试题思路综述 文档

ase、HDFS、Cassandra等。 在google这些技术还未出现之前,企业界在设计大规模分布式系统时,采用的架构往往是database+sharding+cache,现在很多公司(比如taobao,weibo

wujiuliu 2013-06-01   8501   0
P17

  Hadoop1.x以及2.x安装 文档

Hadoop-1.2.1的安装 2.Hadoop-2.6.0的安装 1 Hadoop-1.2.1的安装 1) 伪分布式的安装 a.下载hadoop-1.2.1的包,解压 b.配置环境变量 vim /etc/profile

小牛牛 2015-03-23   2407   0
P14

  ubuntu下搭建hadoop服务器集群 文档

xjavasunjava Linux公社 字号:T | T Hadop是一种分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。 AD:2013云计算架构师峰会课程资料下载

larruping 2017-01-03   1082   0
P74

  Hadoop权威指南-中文版(前三章) 文档

Hadoop管道 40 Hadoop分布式文件系统 44 3.1  HDFS的设计 44 3.2  HDFS的概念 45 3.3  命令行接口 48 3.4  Hadoop文件系统 50 3.5  Java接口 54

我是第一de 2011-10-03   3243   0
P3

  Hadoop 的搭建 文档

hdfs3:/home/mingjie/ hadoop.0.17.1 10、 在hdfs1这个namenode上面格式化一个新的分布式文件系统HDFS,就是hadoop-site.xml文件中指定的hadoop.tmp.dir路径 /bin/hadoop

daibiao 2012-06-13   7728   0
P3

  hadoop实战(虚拟多台电脑) 文档

hdfs3:/home/mingjie/ hadoop.0.17.1 10、 在hdfs1这个namenode上面格式化一个新的分布式文件系统HDFS,就是hadoop-site.xml文件中指定的hadoop.tmp.dir路径 /bin/hadoop

troy-feng 2013-03-10   453   0

Google图算法引擎Pregel介绍 资讯

们,可以参考最新的SIGMOD 2010 ppt[2]。】 简介 Pregel是一个用于分布式图计算的计算框架,主要用于图遍历(BFS)、最短路径(SSSP)、PageRank计算等等。共享内

webphp 2011-08-18   30676   0
Pregel  

Hadoop 集群配置(最全面) 经验

1)   dfs.name.dir是NameNode持久存储名字空间及事务日志的本地文件系统路径。 当这个值是一个逗号分割的目录列表时,nametable数据将会被复制到所有目录中做冗余备份。

fmms 2012-02-06   120812   0

Spark初探 经验

both fast to run and fast to write. Spark 是一个开源的分布式计算系统,它的目的是使得数据分析更快——写起来和运行起来都很快。 Spark 是基于内存计算的大数据并行计算框架。

jopen 2015-01-13   58340   0
P23

  Hbase 分析报告 文档

16.4 和 hbase-0.1.3 编写 Hbase是一个分布式开源数据库,基于Hadoop分布式文件系统,模仿并提供了基于Google文件系统的Bigtable数据库的所有功能。 Hbaes的目标是处

calmdiss 2013-05-11   321   0
1 2 3 4 5 6 7 8 9 10