开源项目,开源代码,开源文档,开源新闻,开源社区

这种转换的中间格式记录集不需要与输入记录集的类型一致。一个给定的输入键值对可以映射成0个或多个输出键值对。 Hadoop Map/Reduce框架为每一个 InputSplit 产生一个map任务，而每个 InputSplit

openkk 2012-05-18 36030 0

在安装好单机模式的hadoop之后，我们就可以着手来在集群模式下安装hadoop了。在安装了单机版hadoop的机器上将hadoop转成集群模式是很容易的。首先来设置网络。网络首先，我们需要在同一个网络的几台机器（这里用的是192

jopen 2013-06-15 14501 0

Hadoop 分布式/云计算/大数据

http://dongxicheng.org/mapreduce-nextgen/hadoop-2-2-0/ Hadoop 2.0的第一个稳定版本2.2.0于2013年10月15如发布了，这个版本是继1

jopen 2014-10-29 20673 0

分布式/云计算/大数据 Hadoop2

本文记录在Hive 0.14 + hadoop 2.4.1 环境下，如何时用 jdbc连接到hive hive 的JDBC驱动还是比较好找的，在hive的包里就有 hive-jdbc-0.14.0-standalone

jopen 2015-01-13 29196 0

Hadoop 分布式/云计算/大数据

1 获取默认配置配置 hadoop ，主要是配置 core-site.xml,hdfs-site.xml,mapred-site.xml 三个配置文件，默认下来，这些配置文件都是空的，所以很难知

jopen 2014-10-29 23537 0

Hadoop 分布式/云计算/大数据

个人谈谈阅读hadoop源代码的经验。首先，不得不说，hadoop发展到现在这个阶段，代码已经变得非常庞大臃肿，如果你直接阅读最新版本的源代码，难度比较大，需要足够的耐心和时间，所以，如果你觉得

ybny 2015-04-24 25911 0

分布式/云计算/大数据 Hadoop

使用Docker在本地搭建hadoop，spark集群简介和环境说明本环境使用的单个宿主主机，而不是跨主机集群，本spark集群环境存在的意义可能在于便于本地开发测试使用，非常轻量级和便捷。这

jopen 2016-01-06 19262 0

Docker Hadoop Spark 分布式/云计算/大数据

P11

下安装配置 hadoop 1.0.4 第一次搞hadoop，折腾我2天，功夫不负有心人，终于搞好了，现在来分享下，我的环境操作系统：wmv虚拟机中的ubuntu12.04 hadoop版本：hadoop-1

zhangbc 2013-09-06 757 0

Hadoop 分布式/云计算/大数据

P5

在windows上建立hadoop-eclipse开发环境参见《hadoop开发者》第一期的“在Windows上安装Hadoop教程” 《Windows下基于Eclipse的Hadoop开发环境完全配置.doc》

lxj2008 2014-01-19 358 0

Hadoop 分布式/云计算/大数据

P33

北京大学本科生学位论文摘要 MapReduce是一个在海量数据上进行数据处理的并行编程模型，它特别适合于海量非结构化和结构化数据的搜索、分析和挖掘任务，已经开始被人们广泛使用。对于兴起的众多类似M

sts2008 2010-12-02 4916 0

云计算 Hadoop 分布式/云计算/大数据

P3

如果有问题，欢迎@banligege Hadoop版本：hadoop-0.21.0 Java版本：1.6.0_26 操作系统： CentOS-5.4-x86_64-bin-DVD.iso 三台机器：一台做master、两台做slave。

foreveract 2013-05-26 2672 0

Hadoop 分布式/云计算/大数据

P8

VM下配置Hadoop详细教程前言： Hadoop是一个分布式系统基础架构，主要是由HDFS、MapReduce和Hbase组成，分别为Google集群系统GFS、MapReduce、BigTab

12csc12 2011-10-19 293 0

Hadoop 分布式/云计算/大数据

P83

Hadoop源代码分析（一）关键字: 分布式 云计算 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster： http://research

cixiang 2010-11-15 335 0

源码 Hadoop 分布式/云计算/大数据

是一个开源的工作流和协作服务引擎，基于 Apache Hadoop 的数据处理任务。Oozie 是可扩展的、可伸缩的面向数据的服务，运行在Hadoop 平台上。 Oozie 包括一个离线的Hadoop处理的工作流解决方案，以及一个查询处理

openkk 2011-12-16 61812 0

Java 工作流引擎

P42

1. Hadoop可靠性概述 2. HDFS可靠性概述 3. HDFS系统架构 4. NameNode元数据结构根目录File01directory01File03Block01Block01_bac

hans511002 2012-06-24 776 0

Hadoop 分布式/云计算/大数据方案报告 Go

P16

1. 亿赞普Hadoop应用浅析IZP 肖燕京密级： 2. 目录一 IZP Hadoop集群现状 Hadoop应用 Hadoop集群维护及出现的问题密级： 3. 一：IZP Hadoop集群现状集群规模

lxz 2014-01-03 625 0

Hadoop 分布式/云计算/大数据

P30

1. 基于Hadoop/HBase的一淘搜索离线系统莫问 2. 个人简介花名：莫问真名：王峰 2006年硕士毕业于北航计算机系毕业后加入阿里巴巴集团雅虎中国 - 垂直搜索团队阿里云 - 计算服务团队

moshco 2017-02-06 642 0

分布式/云计算/大数据方案 SQL XML

我现在集群中有9个slave，我需要配置成map节点5个，reduce节点3个，那么我在master节点的mapred-site.xml中设置之后，是否需要将这个配置文件拷贝到slave节点上去覆盖原先的那个配置文件？

Numen_fan 2017-04-17 1250 0

C/C++ Hadoop XML

互联网大数据综合服务公司，TalkingData也积极地参与到国内Spark社区的各种活动，并多次在Meetup中分享公司的Spark使用经验。本文则主要介绍TalkingData在大数据平台建设过程中，逐渐引入Spark，并且以

jopen 2015-06-08 49372 0

Hadoop 分布式/云计算/大数据

早期的一篇文章，针对Hadoop 2.6.0.这里发一下. 一、Listener Listener线程，当Server处于运行状态时，其负责监听来自客户端的连接，并使用Select模式处理Accept事件。

er74 2015-07-26 15301 0

Hadoop 分布式/云计算/大数据

hadoop mapreduce核心功能描述经验

在Ubuntu上安装集群模式的Hadoop 经验

hadoop2.2稳定版本新特性经验

Hive 0.14 + hadoop 2.4.1 环境下的 jdbc连接经验

Hadoop配置文件参数说明经验

如何高效的阅读hadoop源代码？经验

使用Docker在本地搭建hadoop，spark集群经验

ubuntu下安装配置hadoop1.0.4 文档

在windows上建立hadoop+eclipse开发环境文档

分布计算中的hadoop编程技术文档

Hadoop 搭建步骤（个人整理篇）文档

VM下配置Hadoop详细教程文档

Hadoop源代码分析(完整版) 文档

基于Hadoop的工作流引擎 Oozie 经验

Hadoop可靠性概述(百度) 文档

亿赞普Hadoop应用浅析文档

基于hadoop-hbase的一淘搜索离线系统文档

hadoop集群中配置map／reduce节点数问题问答

从Hadoop到Spark的架构实践经验

Hadoop的Server及其线程模型分析经验

Hadoop的分布式文件系统HDFS属于大数据的相关搜索

关键词

hadoop mapreduce核心功能描述 经验

在Ubuntu上安装集群模式的Hadoop 经验

hadoop2.2稳定版本新特性 经验

Hive 0.14 + hadoop 2.4.1 环境下的 jdbc连接 经验

Hadoop配置文件参数说明 经验

如何高效的阅读hadoop源代码？ 经验

使用Docker在本地搭建hadoop，spark集群 经验

ubuntu下安装配置hadoop1.0.4 文档

在windows上建立hadoop+eclipse开发环境 文档

分布计算中的hadoop编程技术 文档

Hadoop 搭建步骤（个人整理篇） 文档

VM下配置Hadoop详细教程 文档

Hadoop源代码分析(完整版) 文档

基于Hadoop的工作流引擎 Oozie 经验

Hadoop可靠性概述(百度) 文档

亿赞普Hadoop应用浅析 文档

基于hadoop-hbase的一淘搜索离线系统 文档

hadoop集群中配置map／reduce节点数问题 问答

从Hadoop到Spark的架构实践 经验

Hadoop的Server及其线程模型分析 经验

Hadoop的分布式文件系统HDFS属于大数据 的相关搜索

关键词

hadoop mapreduce核心功能描述经验

hadoop2.2稳定版本新特性经验

Hive 0.14 + hadoop 2.4.1 环境下的 jdbc连接经验

Hadoop配置文件参数说明经验

如何高效的阅读hadoop源代码？经验

使用Docker在本地搭建hadoop，spark集群经验

在windows上建立hadoop+eclipse开发环境文档

分布计算中的hadoop编程技术文档

Hadoop 搭建步骤（个人整理篇）文档

VM下配置Hadoop详细教程文档

亿赞普Hadoop应用浅析文档

基于hadoop-hbase的一淘搜索离线系统文档

hadoop集群中配置map／reduce节点数问题问答

从Hadoop到Spark的架构实践经验

Hadoop的Server及其线程模型分析经验

Hadoop的分布式文件系统HDFS属于大数据的相关搜索