P41

  Hadoop Map/Reduce教程 文档

Hadoop Map/Reduce教程[一] 编辑 | 删除 | 权限设置 | 更多▼ 更多▲ · 设置置顶 · 推荐日志 · 转为私密日志 开心延年    发表于2009年11月02日 00:15

wentao 2012-02-03   2837   0
P50

  Hadoop 实战手册 文档

科技改变生活! 思数科技集群部署入门 修订记录 日期 修改原因 描述 作者 2012/02/14 初稿 Hadoop部署文档 2012/07/14 完善细节 新基础环境配置,修改配置文件,修改架构图。 2012/07/16

ka520 2015-11-14   434   0

Hadoop Streaming使用简介 经验

一、Hadoop Streaming 它是hadoop的一个工具,用来创建和运行一类特殊的map/reduce作业。所谓的特殊的map/reduce作业可以是可执行文件或脚本本件(python、P

jopen 2011-12-21   55545   0

Hadoop命令手册 博客

概述 所有的hadoop命令均由bin/hadoop脚本引发。不指定参数运行hadoop脚本会打印所有命令的描述。 用法:hadoop [--config confdir] [COMMAND]

jopen 2012-02-01   4317   0
P27

  Hadoop 分享 文档

发现异常 MapReduce 参与 计算角色 窥探 JOB 运行 MR 提供重写 接口 配置参数调优 Hadoop 组成 3. HDFS 文件系统 4. HDFS 什么是文件系统 文件系统:操作系统用于明确磁盘或分区上的文件的方法和数据结构;

gppxm 2012-10-19   2076   0
P35

  Hadoop及mapreduce入门 文档

1. Hadoop入门卢学裕@优酷网 2012.07 2. OutlinesHadoop Overview HDFS Map-reduce Programming Paradigm Hadoop Map-reduce

P49

  Hadoop Technical Introduction 文档

1. Lecture 11 – Hadoop Technical Introduction 2. TerminologyGoogle calls it:Hadoop equivalent:MapRed

Eric_V72 2013-10-20   347   0

Hadoop 排重优化 经验

如果觉得有帮助的话就顶下吧 在统计的时候经常会用到排重,比如想统计每日登陆用户,但是一个用户一次多次登陆情况,或者一个产品被多少个用户下载。。

ygp8 2015-09-05   6606   0

Hadoop 入门实践 经验

im/2016/03/05/hadoop-101/ Hadoop 2.0 架构 Hadoop 包括如下几个模块: Hadoop Common:公共基础组件; Hadoop Distributed File

Hadoop Hive与Hbase整合 经验

让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库 1. 基于Hadoop+Hive架构对海量数据进行查询:http://blog.csdn.net/kunshan_s

jopen 2012-02-04   180500   0

Hadoop集群设置 经验

Hadoop集群配置部分参数: 设置dfs.name.dir 时,通过逗号分隔多个值,可以使namenode将元数据存储到多个副本,以便namenode出错时恢复。 dfs.data.dir也可设

jopen 2014-01-28   18751   0

Hadoop的使用命令 经验

启动Hadoop 进入HADOOP_HOME 目录。 执行 sh bin/start-all.sh 关闭Hadoop 进入HADOOP_HOME目录。 执行sh bin/stop-all.sh

jopen 2014-10-29   16967   0

Hadoop安装部署 经验

2 安装准备 创建hadoop用户 使用专有用户进行相关操作 # 创建hadoop用户组 groupadd hadoop # 创建hadoop用户 useradd hadoop # 设置密码 passwd

ymc4 2015-02-11   28859   0

Hadoop】HDFS的运行原理 经验

简介 HDFS (Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Google File System)Google

wdey 2015-05-24   13886   0
P10

  Hadoop 运行流程 文档

Hadoop包括hdfs与mapreduce两部分,在使用期期间我主要看了mapreduce部分,即hadoop执行作业的部分。 1. mapreduce中几个主要的概念 mapreduce整体上可

szx85307 2012-05-28   2711   0
P3

  hadoop常见错误总结 文档

Hadoop常见错误总结 2010-12-30 13:55 错误1:bin/hadoop dfs 不能正常启动,持续提示: INFO ipc.Client: Retrying connect to server:

419133824 2012-02-18   5004   0
P5

  hadoop安装步骤 文档

Hadoop 2.6安装文档 1. JDK 安装   1. 解压JDK安装包    2. 配置 /etc/profile,加入以下内容          export JAVA_HOME=/home/hadoop/jdk1

hiCamp 2017-01-11   552   0
P

Hadoop 1.2.1 API 文档 文档

Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,任何人都可以使用。

allen789 2013-10-31   7446   0
P

Hadoop 入门手册 文档

MapReduce编程模型的思想来源于函数式编程语言Lisp,由Google公司于2004年提出并首先应用于大型集群。同时,Google也发表了GFS、BigTable等底层系统以应用MapReduce模型。在2007年,Google’s MapReduce Programming Model-Revisted论文发表,进一步详细介绍了Google MapReduce模型以及Sazwall并行处理海量数据分析语言。Google公司以MapReduce作为基石,逐步发展成为全球互联网企业的领头羊。 <br> Hadoop作为Apache基金会资助的开源项目,由Doug Cutting带领的团队进行开发,基于Lucene和Nutch等开源项目,实现了Google的GFS和Hadoop能够稳定运行在20个节点的集群;2006年1月,Doug Cutting加入雅虎公司,同年2月Apache Hadoop项目正式支持HDFS和MapReduce的独立开发。同时,新兴公司Cloudera为Hadoop提供了商业支持,帮助企业实现标准化安装,并志愿贡献社区。Hadoop的最新版本是0.21.0,说明其还在不断完善发展之中。

030472875ken 2012-01-19   5752   0
P11

  Hadoop 安装手册 文档

 概要设计 HADOOP安装手册 v0.1 Date Version Description Author 2011-7-18 0.1 Initial 杨哲 Page of 11 概要设计 目录 Page

ccvcd 2014-04-10   394   0
1 2 3 4 5 6 7 8 9 10