P10

  Hadoop 知识总结(最终总结) 文档

本文档主要是针对Hadoop最基本知识的了解,对于刚刚接触Hadoop学习过程中的总结。Hadoop是什么Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。

sweetbaybe 2012-03-14   3088   0
P25
P8

  Hadoop安装最终版 文档

在Microsoft Windows XP操作系统下,安装Ubuntu8.04 lts server版本+xubuntu桌面到VMware虚拟机上。

szx85307 2012-05-28   2632   0
P83

  Hadoop源代码分析 文档

目前,基于类似思想的Open Source项目还很多,如Facebook用于用户分析的Hive。 HDFS作为一个分布式文件系统,是所有这些项目的基础。分析好HDFS,有利于了解其他系统。由于Hadoop的HDFS和MapReduce是同一个项目,我们就把他们放在一块,进行分析。

leroy 2011-08-16   3752   0
P8

  自己整理的Hadoop Hive MapReduce 文档

Hadoop是2005 Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样,MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要有什么并发处理或者分布式系统的经验,就可以处理超大的分布式系统得资源。

xfj3526 2012-06-13   5194   0
P12

  CentOS的Hadoop集群配置 文档

以下集群配置内容,以两台机器为例。其中一台是master,另一台是slave1。 master上运行name node, data node, task tracker, job tracker,secondary name node; slave1上运行data node, task tracker。

tony2007 2015-06-20   486   0
P4

  Hadoop 集群搭建 文档

机器规格CPU:2个四核2~2.5GHzCPU内存:8~16GBECCRAM(非ECC会产生校验和错误)存储器:4*1TSATA硬盘(硬盘大小一般是数据量的3—5倍)网络:千兆以太网PS:namenode一般采用64位硬件,避免32位机java堆3g限制具体规格情况跟数据量有关。

serisboy12 2015-04-02   1475   0
P27

  Hadoop与数据分析 文档

Hadoop基本概念,Hadoop的应用范围,Hadoop底层实现原理,Hive与数据分析,Hadoop集群管理典型的Hadoop离线分析系统架构。

zhpboy 2013-10-12   4361   0
P0

  Hadoop现场演示与编程过程 文档

主要内容实验平台简介Hadoop环境搭建MapReduce编程实验平台简介采用XenServer分布式部署Hadoop浪潮380D5台虚拟机(CentOS)采用VirtualBox分布式部署Hadoop PC5 台虚拟机(CentOS)采用XenServer分布式部署Hadoop采用VirtualBox分布式部署Hadoop Hadoop环境搭建Hadoop的三种部署模式Hadoop完全分布式部署HDFS节点故障演示Hadoop的三种部署模式。

opend7y8 2012-12-15   3313   0
P7

  Hadoop 安装部署步骤 文档

本文以虚拟机安装hadoop集群为例!!!安装过程

sweetbaybe 2012-12-24   3131   0
P39

  Hadoop深入浅出 文档

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具。

boke_jian 2014-08-21   3010   0
P55

  Hadoop入门实战手册 文档

Hadoop 由 Apache Software Foundation 公司于 2005 年秋天作为 Lucene 的子项目 Nutch 的一部分正式引入。它受到最先由 Google Lab 开发的 MapReduce 和 Google File System 的启发。2006 年 3 月份,MapReduce 和 Nutch Distributed File System (NDFS) 分别被纳入称为 Hadoop 的项目中。<br> Hadoop并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的基础框架。它由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。

somnus_sta 2012-09-13   629   0
P10

  hadoop&&spark安装教程 文档

本教程使用Ubuntu12.0464位作为系统环境(Ubuntu14.04也行,32位、64位均可),请自行安装系统装好了Ubuntu系统之后,在安装Hadoop前还需要做一些必备工作。

P3

  Hadoop 集群环境部署 文档

一准备工作准备4台ubuntu操作系统的linux服务器,要求系统版本遗址Jdk1.6,hadoop0.20.2安装包,ssh为系统都统一创建一个名称相同的用户二搭建工作环境2.1安装jdk1.6(不做详细介绍)2.2实现ssh无密码验证1.终端输入ssh-keygen–trsa–P2.直接回车采用默认路径。生成的密钥对:id_rsa和id_rsa.pub,默认存储在“/home/hadoop/.ssh”目录下

jemissary 2012-11-15   3293   0
P10

  Hadoop 知识总结(最终总结) 文档

本文档主要是针对Hadoop最基本知识的了解,对于刚刚接触Hadoop学习过程中的总结。Hadoop是什么Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(highthroughput)来访问应用程序的数据,适合那些有着超大数据集(largedataset)的应用程序。

sweetbaybe 2012-03-05   5003   0
P9

  Hadoop API 使用介绍 文档

Map/Reduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的,Google已经将它完整的MapReduce论文公开发布了。其中对它的定义是,Map/Reduce是一个编程模型(programming model),是一个用于处理和生成大规模数据集(processing and generating large data sets)的相关的实现。用户定义一个map函数来处理一个key/value对以生成一批中间的key/value对,再定义一个reduce函数将所有这些中间的有着相同key的values合并起来。很多现实世界中的任务都可用这个模型来表达。 Hadoop的Map/Reduce框架也是基于这个原理实现的,下面简要介绍一下Map/Reduce框架主要组成及相互的关系。

whyqq1987 2012-03-19   3909   0
P16

  Hadoop 源码的入门解析 文档

Hadoop原来是Apache Lucene下的一个子项目,它最初是从Nutch项目中分离出来的专门负责分布式存储以及分布式运算的项目。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。

sweetbaybe 2012-12-27   2723   0
P1

  hadoop面试小结 文档

hadoop面试小结

wujiuliu 2013-05-31   7460   0
P5
P42

  Guagua An Iterative Computing Framework on Hadoop 文档

Introduction Distributed Neural Network Algorithm What is Guagua? Guagua Advanced Features Shifu on Guagua Future Plans

dfwm 2014-10-19   1684   0
1 2 3 4 5 6 7 8 9 10