Hadoop的Jython封装 Happy 经验

Hadoop + Python = Happy Happy 为Jython开发者使用Hadoop框架提供了便利,Happy框架封装了Hadoop的复杂调用过程,让Map-Reduce开发变得更为容

openkk 2012-06-08   16928   0

Spark与Hadoop的结合 经验

point。 RDD的不变性,可以实现类Hadoop MapReduce的推测式执行。 RDD的数据分区特性,可以通过数据的本地性来提高性能,这与Hadoop MapReduce是一样的。 RDD都是

jopen 2014-09-23   100810   0

Hadoop 集群常见错误 经验

这里将自己在初识hadoop过程中遇到的一些错误做一个简单总结: (一)启动 hadoop 集群时易出现的错误: 1. 错误现象: java.net.NoRouteToHostException:

openkk 2012-03-05   99244   0
P129

  Hadoop 从入门到精通 文档

超人Hadoop网络学习社区—http://bbs.superwu.cn|吴超.沉思录 第1章:环境准备 1.1.VirtualBox的安装 VirtualBox简介 VirtualBox号称是免费

beat_it 2013-11-16   525   0
P41

  Hadoop Map/Reduce教程 文档

http://user.qzone.qq.com/165162897/blog/1257776641 Hadoop Map/Reduce教程[一] 编辑 | 删除 | 权限设置 | 更多▼ 更多▲ · 设置置顶

Tonywang 2011-08-08   5052   0
P

Hadoop入门手册 文档

MapReduce编程模型的思想来源于函数式编程语言Lisp,由Google公司于2004年提出并首先应用于大型集群。同时,Google也发表了GFS、BigTable等底层系统以应用MapReduce模型。在2007年,Google’s MapReduce Programming Model-Revisted论文发表,进一步详细介绍了Google MapReduce模型以及Sazwall并行处理海量数据分析语言。Google公司以MapReduce作为基石,逐步发展成为全球互联网企业的领头羊。Hadoop作为Apache基金会资助的开源项目,由Doug Cutting带领的团队进行开发,基于Lucene和Nutch等开源项目,实现了Google的GFS和Hadoop能够稳定运行在20个节点的集群;2006年1月,Doug Cutting加入雅虎公司,同年2月Apache Hadoop项目正式支持HDFS和MapReduce的独立开发。同时,新兴公司Cloudera为Hadoop提供了商业支持,帮助企业实现标准化安装,并志愿贡献社区。Hadoop的最新版本是0.21.0,说明其还在不断完善发展之中。

gopen 2011-10-20   1001   0
P

Hadoop 0.20.203.0 API 文档

Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性(fault-tolerent)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。

perfectqgw 2012-11-18   3212   0
P

Hadoop 0.20.1 API 文档

Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性(fault-tolerent)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。

wanjia19 2011-08-10   6182   0
P3

  Hadoop任务调度 文档

Hadoop任务调度 在Master上运行的是JobTracker守护进程,而在Slave上运行的是TaskTracker守护进程。对于一个作业,首先提交给JobTracker,再由JobTracker对提交的作业进行处理。

thinkingx 2011-12-15   5872   0
P2

  Hadoop API组成 文档

Hadoop API组成 Hadoop API被分成(divide into)如下几种主要的包(package) 序号 名称 说明 1. org.apache.hadoop.conf 定义了系统参数的配置文件处理API。

willfly 2011-08-28   4194   0
P7

  Hadoop 命令大全 文档

所有的Hadoop命令均由bin/hadoop脚本引发。不指定参数运行hadoop脚本会打印所有命令的描述。 The general command line syntax is: hadoop [--config

xfj3526 2012-06-13   3684   0
P41

  Hadoop Map/Reduce教程 文档

Hadoop Map/Reduce教程[一] 编辑 | 删除 | 权限设置 | 更多▼ 更多▲ · 设置置顶 · 推荐日志 · 转为私密日志 开心延年    发表于2009年11月02日 00:15

wentao 2012-02-03   2837   0
P50

  Hadoop 实战手册 文档

作者 2012/02/14 初稿 Hadoop部署文档 2012/07/14 完善细节 新基础环境配置,修改配置文件,修改架构图。 2012/07/16 完善细节 完善系统检查方法,完善目录结构和注释,添加封面

ka520 2015-11-14   434   0

Hadoop Streaming使用简介 经验

一、Hadoop Streaming 它是hadoop的一个工具,用来创建和运行一类特殊的map/reduce作业。所谓的特殊的map/reduce作业可以是可执行文件或脚本本件(python、P

jopen 2011-12-21   55545   0

Hadoop命令手册 博客

概述 所有的hadoop命令均由bin/hadoop脚本引发。不指定参数运行hadoop脚本会打印所有命令的描述。 用法:hadoop [--config confdir] [COMMAND]

jopen 2012-02-01   4317   0
P27

  Hadoop 分享 文档

HDFS 文件系统 与 HDFS 窥探内部结构 运行 正常流程 / 非正常流程 / 发现异常 MapReduce 参与 计算角色 窥探 JOB 运行 MR 提供重写 接口 配置参数调优 Hadoop 组成 3

gppxm 2012-10-19   2076   0
P35

  Hadoop及mapreduce入门 文档

1. Hadoop入门卢学裕@优酷网 2012.07 2. OutlinesHadoop Overview HDFS Map-reduce Programming Paradigm Hadoop Map-reduce

P49

  Hadoop Technical Introduction 文档

1. Lecture 11 – Hadoop Technical Introduction 2. TerminologyGoogle calls it:Hadoop equivalent:MapRed

Eric_V72 2013-10-20   347   0

Hadoop 排重优化 经验

如果觉得有帮助的话就顶下吧 在统计的时候经常会用到排重,比如想统计每日登陆用户,但是一个用户一次多次登陆情况,或者一个产品被多少个用户下载。。

ygp8 2015-09-05   6606   0

Hadoop 入门实践 经验

im/2016/03/05/hadoop-101/ Hadoop 2.0 架构 Hadoop 包括如下几个模块: Hadoop Common:公共基础组件; Hadoop Distributed File

1 2 3 4 5 6 7 8 9 10