开源项目,开源代码,开源文档,开源新闻,开源社区

hadoop 学习笔记：mapreduce框架详解开始聊mapreduce，mapreduce是hadoop的计算框架，我学hadoop是从hive开始入手，再到hdfs，当我学习hdfs

jopen 2014-08-29 30078 0

open-open.com/lib/view/open1409640189307.html 2 、 Hadoop 节点配置在讲解之前，先声明一点，这篇文章的所有环境都是基于上一篇伪分布的配置文章的基础

jopen 2014-11-22 27139 0

Apache Falcon 是一个面向Hadoop的、新的数据处理和管理平台，设计用于数据移动、数据管道协调、生命周期管理和数据发现。它使终端用户可以快速地将他们的数据及其相关的处理和管理任务“上载（onboard）”到Hadoop集群。

jopen 2015-01-29 67916 0

分布式/云计算/大数据 Apache Falcon

术是弹性分布式数据集(Resilient distributed datasets)，提供了比Hadoop更加丰富的MapReduce模型，可以快速在内存中对数据集进行多次迭代，来支持复杂的数据挖掘算法和图计算

jopen 2014-12-03 46280 0

Spark 分布式/云计算/大数据

HDFS简单介绍 HDFS全称是Hadoop Distribute File System,是一个能运行在普通商用硬件上的分布式文件系统。与其他分布式文件系统显著不同的特点是： HDFS是一个高容错系统且能运行在各种低成本硬件上；

jopen 2016-01-12 16076 0

HDFS Hadoop 大数据分布式/云计算/大数据

hadoop 的mapreduce 的作业在运行过程中常常碰到一些这样的情况：每一个map或者reduce只有30-40秒钟就结束超大规模的job 时，通常会需要大量的map和reduce的slots

jopen 2016-01-16 7166 0

Hadoop 分布式/云计算/大数据

HadoopDemo Hadoop简单应用案例，包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用等运行环境： java 1.8 hadoop1.1.2

jopen 2015-12-04 19595 0

Hadoop 分布式/云计算/大数据

Spark 安装前提安装 Spark 之前需要先安装 Hadoop 集群，因为之前已经安装了 hadoop ，所以我直接在之前的 hadoop 集群上安装 spark ，但是因为机器内存不够，我只选择

yvdyyn805 2016-01-27 45467 0

分布式/云计算/大数据

免秘钥创建hadoop用户和用户组，节点名称 IP1 IP2 备注 node1.com 192.168.122.128 动态联网 root/123456 hadoop/hadoop node2.com

jopen 2016-01-18 16615 0

分布式/云计算/大数据

它是如何将RDBMS实时数据流导入到HDFS的Hive表中。对于那些想要把数据快速摄取到Hadoop中的企业来讲，Kafka是一个很好的选择。Kafka是什么？Kafka是一个分布式、可伸缩、可

LynHolcomb 2016-08-30 31986 0

数据库 Hadoop 分布式/云计算/大数据 Apache Kafka

环境部署Hadoop系统的用户来说，最常遇到的就是扩展问题，此类问题往往导致企业因噎废食，终止大数据应用项目。部署和扩展Hadoop系统是一件高度复杂的事情，如果用户能提前对Hadoop扩展可能

174384143 2016-08-30 15119 0

Hadoop大数据分布式/云计算/大数据

P23

1. 分布式运算平台-Hadoop-基础篇马云龙 2. 1：大规模数据处理的问题 2：Hadoop的由来 3：Hadoop需要解决的问题 4：Hadoop介绍 5：HDFS介绍 6：MapReduce介绍

zhpboy 2013-10-12 3298 0

Hadoop 分布式/云计算/大数据 Apache C/C++ Go

P22

li270606338 2013-08-28 7576 0

Hadoop 分布式/云计算/大数据 Go

上次见到（膜拜）Hadoop之父Doug Cutting是在 2年前，2014中国大数据技术大会上。今年Hadoop10岁，刚看到他的 Hadoop十周年贺词，感觉时间飞逝。最近CSDN和Info

jopen 2016-02-15 25367 0

Hadoop 大数据

P15

CentOS6.2下Hadoop全分布式集群配置文档文档更新记录编写人日期版本号变更内容审核人田文武 2012/07/27 V1.0 新建集群网络环境介绍集群包含三个hadoop节点：1个n

wuguai 2012-09-19 5452 0

Hadoop 分布式/云计算/大数据

P13

Hadoop：分布式大数据处理架构由于具备低成本和前所未有的高扩展性，Hadoop已被公认为是新一代的大数据处理平台。就像30年前SQL（Structured Query Language）出

xcxc 2015-08-24 614 0

Hadoop 分布式/云计算/大数据

P12

Hadoop开发环境搭建（Win8+Linux）常见的Hadoop开发环境架构有以下三种： 1、 Eclipse与Hadoop集群在同一台Windows机器上。 2、 Eclipse与Hadoop集群在同一台Linux机器上。

pdddy 2013-09-23 8604 0

Hadoop 分布式/云计算/大数据

Hadoop 简介：一个分布式系统基础架构，由 Apache 基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统（Hadoop

openkk 2012-02-15 57210 0

Hadoop 分布式/云计算/大数据

1、集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统（HDFS，Hadoop Distributed F

jopen 2013-10-24 69931 0

Hadoop 分布式/云计算/大数据

点网络.下面进行详细介绍： Topologies 用于封装一个实时计算应用程序的逻辑，类似于 Hadoop 的 MapReduce Job Stream 消息流，是一个没有边界的 tuple 序列，这些

jopen 2013-11-13 35568 0

Storm 分布式/云计算/大数据

hadoop 学习笔记：mapreduce框架详解经验

Hadoop2.5.0完全分布式配置(1主3从) 经验

面向Hadoop的、新的数据处理和管理平台：Apache Falcon 经验

Spark：比Hadoop更强大的分布式数据计算项目经验

大数据技术hadoop入门理论系列之二—HDFS架构简介经验

提高hadoop的mapreduce job效率笔记—–修改mapper和reducer数量经验

Hadoop简单应用案例，包括MapReduce、单词统计、HDFS基本操作等经验

Hadoop2.6.0上的spark1.5.2集群搭建经验

hadoop再次集群搭建（2）-配置免秘钥ssh登录经验

Kafka实战：从RDBMS到Hadoop，七步实现实时传输经验

Hadoop大数据系统的七大危险信号经验

分布式运算平台-Hadoop-基础篇文档

MapReduce详解及Eclipse远程连接Hadoop开发MapReduce程序文档

Hadoop十岁！Doug Cutting成长史+他眼中大数据技术的未来资讯

CentOS6.2 下 Hadoop 全分布式集群配置文档文档

Hadoop：分布式大数据处理架构文档

Hadoop开发环境搭建(Win8+Linux) 文档

Hadoop HDFS分布式文件系统设计要点与架构经验

Hadoop集群部署及常见问题超细详解答经验

Spring hadoop之发散之Storm云计算学习摘录总结经验

K-means Hadoop 的相关搜索

关键词

hadoop 学习笔记：mapreduce框架详解 经验

Hadoop2.5.0完全分布式配置(1主3从) 经验

面向Hadoop的、新的数据处理和管理平台：Apache Falcon 经验

Spark：比Hadoop更强大的分布式数据计算项目 经验

大数据技术hadoop入门理论系列之二—HDFS架构简介 经验

提高hadoop的mapreduce job效率笔记—–修改mapper和reducer数量 经验

Hadoop简单应用案例，包括MapReduce、单词统计、HDFS基本操作等 经验

Hadoop2.6.0上的spark1.5.2集群搭建 经验

hadoop再次集群搭建（2）-配置免秘钥ssh登录 经验

Kafka实战：从RDBMS到Hadoop，七步实现实时传输 经验

Hadoop大数据系统的七大危险信号 经验

分布式运算平台-Hadoop-基础篇 文档

MapReduce详解及Eclipse远程连接Hadoop开发MapReduce程序 文档

Hadoop十岁！Doug Cutting成长史+他眼中大数据技术的未来 资讯

CentOS6.2 下 Hadoop 全分布式集群配置文档 文档

Hadoop：分布式大数据处理架构 文档

Hadoop开发环境搭建(Win8+Linux) 文档

Hadoop HDFS分布式文件系统设计要点与架构 经验

Hadoop集群部署及常见问题超细详解答 经验

Spring hadoop之发散之Storm云计算学习摘录总结 经验

K-means Hadoop 的相关搜索

关键词

hadoop 学习笔记：mapreduce框架详解经验

Spark：比Hadoop更强大的分布式数据计算项目经验

大数据技术hadoop入门理论系列之二—HDFS架构简介经验

提高hadoop的mapreduce job效率笔记—–修改mapper和reducer数量经验

Hadoop简单应用案例，包括MapReduce、单词统计、HDFS基本操作等经验

Hadoop2.6.0上的spark1.5.2集群搭建经验

hadoop再次集群搭建（2）-配置免秘钥ssh登录经验

Kafka实战：从RDBMS到Hadoop，七步实现实时传输经验

Hadoop大数据系统的七大危险信号经验

分布式运算平台-Hadoop-基础篇文档

MapReduce详解及Eclipse远程连接Hadoop开发MapReduce程序文档

Hadoop十岁！Doug Cutting成长史+他眼中大数据技术的未来资讯

CentOS6.2 下 Hadoop 全分布式集群配置文档文档

Hadoop：分布式大数据处理架构文档

Hadoop HDFS分布式文件系统设计要点与架构经验

Hadoop集群部署及常见问题超细详解答经验

Spring hadoop之发散之Storm云计算学习摘录总结经验