P

Hadoop 官方中文文档 文档

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。

hans511002 2012-06-24   345   0
P7

  hadoop安装指南及基本命令 文档

Hadoop安装指南 安装JDK(参考jdk的安装文档) 关闭防火墙: (1) 重启后永久性生效:    开启:chkconfig iptables on   关闭:chkconfig iptables off   

beauty2003 2016-05-10   416   0
P8

  Lucene+Hadoop分布式 文档

Nut开发环境搭建(虚拟机下hadoop0.20.2+zookeeper3.3.3+hbase0.90.2开发环境的搭建) blog: http://www.blogjava.net/nianzai/

huaxinmifeng 2011-10-27   7864   0
P33

  Hadoop中HDFS源代码分析 文档

 Hadoop中HDFS源代码分析 目 录 一、Hadoop系统基础 - 1 - 1.1、Hadoop简介 - 1 - 1.2、Hadoop的项目组成 - 2 - 1.3、Hadoop基本架构模型 -

gps2012 2013-01-14   519   0
P7

  Hadoop 的一周学习心得 文档

Hadoop的一周学习心得 --徐少辉 一、 Hadoop (一) Hadoop是什么 Apache的Hadoop是一个商业硬件上运行的建造大型集群应用的框架。透明的Hadoop框架提供应用可靠性和

xsh1019 2013-01-05   3560   0
P4

  Hadoop后台进程介绍 文档

Hadoop后台进程介绍: 1.名称节点NameNode 名称节点是Hadoop后台进程中最重要的部分。Hadoop以一种主/从结构来实现分布式文件系统和分布式计算。分布式文件系统被称为Hadoop File

willfly 2011-08-28   7104   0
P39

  Hadoop:The Definitive Guid 学习笔记 文档

Hadoop:The Definitive Guid学习笔记 mingyuan Email:cn.mingyuan@foxmail.com 1. Meet Hadoop 1.1. Data 数据

ch1990 2013-06-17   2068   0

Hadoop批处理调度器 Azkaban 经验

Azkaban 是个简单 的 批处理调度器,用来构建 和 运行 Hadoop作业 或 其他脱机 过程 。 Hadoop 并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架。

fmms 2011-11-29   29810   0

Hadoop 一:完美集群搭建 博客

JobTracker 可以是同一台机器,也可以分开; # Secondary NameNode 在 Hadoop-1.0.3 中被废弃,用 Checkpoint Node 和 Backup No de 来代替;

jopen 2012-09-14   2672   0
P26

  基于Hadoop的电影推荐系统 文档

1. 基于Hadoop的电影推荐系统 答辩者:李婷婷 指导老师:师智斌 2. Hadoop在大型内容推荐系统中的应用 背景  推荐效果  技术选型  技术实现  推荐系统的评测  Hadoop&Hive使用经验

P24

  Hadoop 平台结构浅析 文档

1. Hadoop平台结构浅析什么是Hadoop? Hadoop是Apache下面的一个分布式并行计算框架,是从Lunece中抽取出来的一个框架。Hadoop的核心设计思想是MapReduce和HDFS

liu1122 2013-01-20   2848   0
P23

  Hadoop 运维杂记 文档

1. Hadoop运维杂记张月@蓝汛 2. 自我介绍张月 性别男,爱好女 就职于蓝汛Chinacache数据平台日志Team 工作内容:开发,运维基于hadoop数据平台及其生态系统;公司内部Hadoop技术推广;

lxz 2014-01-03   2998   0
P31

  Hadoop深入浅出 - MapReduce 文档

3774 86624 2. 课程安排MapReduce原理*** MapReduce执行过程** 数据类型与格式*** Writable接口与序列化机制*** --------------------

boke_jian 2014-08-21   2675   0

Hadoop - Ambari集群管理剖析 经验

1.Overview Ambari是Apache推出的一个集中管理Hadoop的集群的一个平台,可以快速帮助搭建Hadoop及相关以来组件的平台,管理集群方便。这篇博客记录Ambari的相关问题和

jopen 2015-12-25   256529   0

elasticsearch-hadoop使用示例 经验

在elasticsearch-hadoop的具体使用中碰到了几个问题,有必要记录一下,避免下次遇到时又要重新研究。 利用spark读取es数据源的简单示例 import org.elasticsearch

jopen 2016-01-07   22370   0

hadoop2.6.3 集群部署 经验

root@slave1:~# 安装hadoop 下载hadoop2.6.3,下载链接 http://hadoop.apache.org/releases.html 解压 tar -xvf hadoop-2.6.3.tar

StevenGrey 2016-01-27   21394   0
P23

  Hadoop 源代码分析(MapReduce概论) 文档

2009-02-21 Hadoop源代码分析(MapReduce概论) 大家都熟悉文件系统,在对HDFS进行分析前,我们并没有花很多的时间去介绍HDFS的背景,毕竟大家对文件系统的还是有一定的理解的

gps2012 2013-01-14   247   0
P5

  hadoop集群配置范例 文档

HADOOP-0.20.2分布式集群配置 本文以安装和使用hadoop-0.20.2为例。 硬件环境 1. 虚拟机VMWare Workstation 6.5.2build 2. 三台机器均安装redhat

tony2007 2015-06-20   260   0

Hadoop平台集群搭建 经验

1. Linux配置hadoop环境 环境:Ubuntu10 linux、 jdk-7-linux-i586.tar.gz 1.1 将jdk上传到Ubuntu a. 在虚拟机中设置->选项->共享文件夹

jopen 2014-03-19   12260   0

hadoop 网站日志分析 经验

org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import

jopen 2014-03-26   19031   0
1 2 3 4 5 6 7 8 9 10