Zookeeper 在Hadoop中的应用 经验

Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。

jopen 2015-06-24   24315   0

hadoop调度算法 经验

1 hadoop目前支持以下三种调度器: FifoScheduler:最简单的调度器,按照先进先出的方式处理应用。只有一个队列可提交应用,所有用户提交到这个队列。没有应用优先级可以配置。

jopen 2016-01-03   10037   0
P26

  Hadoop Performance at LinkedIn 文档

Hadoop Performance at LinkedIn

b8gp 2014-10-10   2310   0
P150

  Hadoop 介绍 文档

Hadoop是什么?一个分布式文件系统和并行执行环境;一个软件集;让用户便捷地处理海量数据;Apache软件基金会下面的一个开源项目;目前Yahoo!是最主要的贡献者;Hadoop子项目Hadoop Common:在0.20及以前的版本中,包含HDFS、MapReduce和其他项目公共内容,从0.21开始HDFS和MapReduce被分离为独立的子项目

tony2007 2015-06-20   625   0
P29

  Docker Based Hadoop Provisioning 文档

Thanks for coming – today will talk about Docker based Hadoop provisioning. Quick introduction of who we are - Young startup, from Budapest, Hungary. Janos Matyas – CTO, open source contributor, Hadoop YARN evangelist. Ease Hadoop provisioning – everywhere Automate and unify the process Arbitrary cluster size Same process through a cluster lifecycle (Dev, QA, UAT, Prod) (Auto) scaling Hadoop

pwgw 2016-02-04   504   0
P28

  Hadoop下MapReduce编程 文档

内容:MapReduce概述,MapReduce的数据流,检查点,相关编程要点,Map过程Map过程通过在输入列表中的每一项执行函数,生成一系列的输出列表。Reduce过程Reduce过程在一个输入的列表进行扫描工作,随后生成一个聚集值,作为最后的输出MapReduce的Reduce过程所有不同的颜色代表不同的键值(keys)。

slayerlyy 2011-11-22   4450   0
P26

  Hadoop实用指南 文档

Sogou的Hadoop生态系统 Hadoop Quick Start 深入MapReduce 了解MapReduce运行机制 如何调试MapReduce MultiInput & MultiOutput 数据Join操作 关于UigsTools MapReduce进阶开发模式 各类资源列表

yudian 2014-10-29   1898   0
P18

  Hadoop 介绍 文档

Hadoop的简介;Map Reduce介绍;Hadoop 执行步骤;Hadoop 的安装和配置应用情景分析一、Hadoop的简介hadoop是做什么的?Hadoop为云计算平台提供了一种分布式存储和并行计算的能力。将大块的数据文件,如数据规模在G、T级别,进行切割并进行分布式存储;hadoop的mapreduce计算模型,将计算任务按照分割文件拆解并进行分布式并行计算,后再对计算结果进行汇总。

amen1024 2012-08-03   6077   0

Hadoop中文文档 博客

Hadoop中文文档 http://hadoop.apache.org/common/docs/r0.17.2/cn/

whatot 2011-11-18   3816   0

Hadoop是什么 博客

Hadoop 原来是 Apache Lucene 下的一个子项目,它最初是从 Nutch 项目中分离出来的专门负责分布式存储以及分布式运算的项目。简单地说来, Hadoop 是一个可以更容易开发和运行处理大规模数据的软件平台。下面列举 hadoop 主要的一些特点: 扩容能力( Scalable ) :能可靠地( reliably )存储和处理千兆字节( PB )数据。 成本低( Economic

jopen 2012-02-01   1098   0
lamp  
P24

  Apache Hadoop介绍 文档

Apache Hadoop是一个用java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,它可以让应用程序支持上千个节点和PB级别的数据。Hadoop的核心子项目,提供了一个分布式文件系统(HDFS)和支持MapReduce的分布式计算。

观光阁 2011-05-15   17718   0

Nutch Hadoop 教程 博客

怎样安装Nutch和 Hadoop 搜寻网页和邮件列表,似乎很少有关于如何使用Hadoop (曾经的DNFS)分布式文件系统( HDFS )和MapReduce来安装Nutch的文章 。 本教程的目的是通过逐步讲解的方法,来讲解了如何在多节点的Hadoop文件系统上运行Nutch,包括能够同时索引(爬取)和搜寻多台机器。 这篇文档没有涉及到Nutch或Hadoop架构。它只是讲述了如何让系统启动和

Hadoopp 2012-09-28   6548   0
屌丝  

Hadoop生态图谱 博客

当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。 这一切,都起源自Web数据爆炸时代的来临 数据抓取系统 - Nutch 海量数据怎么存,当然是用分布式文件系统 - HDFS 数据怎么用呢,分析,处理 MapReduce框架,让你编写代码来实现对

ppucd 2012-10-12   1495   0
lamp  
P23

  Yahoo的Hadoop教程 文档

欢迎来到Yahoo! Hadoop教程!这个系列教程将向你介绍Apache Hadoop系统的许多方向,还将向你展示:如何进行简单和高级的集群配置;如何使用分布式文件系统;如何使用分布式文件系统,如何开发复杂的Hadoop MapReduce应用,并且其它相关的分布式系统也提及。Hadoop是一个大规模分布式批处理架构,虽然它在单台计算机上也能使用,但它的真正能力是在成百上千计算机上运行时才显现出来,Hadoop可以高效地将大量工作高效地分布到一组计算机上。

linyouzhu 2012-05-31   6122   0
P20

  hadoop个人理解 文档

ymkyve 2016-12-26   2233   0

Hadoop 实战实例 经验

Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要有什么并发处理或者分布式系统的经验,就可以处理超大的分布式系统得资源。

fmms 2012-02-08   150779   0

MongoDB Hadoop Adapter 经验

Hadoop的MongoDB适配器。需要MongoDB Java Driver 2.7.3+支持。

openkk 2012-04-10   19922   0
P3

  Hadoop 的搭建 文档

Hadoop的搭建

daibiao 2012-06-13   7728   0

hadoop压缩与解压 经验

一 般来说,计算机处理的数据都存在一些冗余度,同时数据中间,尤其是相邻数据间存在着相关性,所以可以通过一些有别于原始编码的特殊编码方式来保存数据, 使数据占用的存储空间比较小,这个过程一般叫压缩。和压缩对应的概念是解压缩,就是将被压缩的数据从特殊编码方式还原为原始数据的过程。

jopen 2014-10-20   54797   0

Hadoop各个类的作用 经验

1.基础包(包括工具包和安全包) 包括工具和安全包。其中,hdfs.util包含了一些HDFS实现需要的辅助数据结构;hdfs.security.token.block和hdfs.security.token.delegation结合Hadoop的安全框架,提供了安全访问HDFS的机制。

jopen 2014-02-18   63842   0
1 2 3 4 5 6 7 8 9 10