P230

  Hadoop之HBase从入门到精通 文档

一、 HBase技术介绍 HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

ijamesbond 2015-03-17   6869   0

Hadoop HDFS文件操作的Java代码 经验

apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path;

jopen 2013-07-11   84118   0

Hadoop批处理调度器 Azkaban 经验

Azkaban是个简单的批处理调度器,用来构建和运行Hadoop作业或其他脱机过程。 项目主页: http://www.open-open.com/lib/view/home/1339233539396

openkk 2012-06-09   16216   0

Hadoop五分钟入门指南 经验

原文见: http://blog.josedacruz.com/2013/12/09/hadoop-in-5-minutes-for-beginners/#.Uqhs3_Q6Cjt 如果你有大量的

jopen 2013-12-12   21448   0

Hadoop集群监控工具:HTools 经验

HTools是一款专业的Hadoop管 理工具,不管您是非专业IT人士,还是多年经验的技术人员,本工具都会为您提供优质的管理服务和轻松的操作过程, 释放无谓的工作压力,提高Hadoop的管理水平。我们以最

jopen 2013-12-25   39788   0

Hadoop中MapReduce框架入门 经验

ogle提出,主要用于搜索领域,解决海量数据的计算问题.对于业 界的大数据存储及分布式处理系统来说Hadoop2提出的新MapReudce就是YARN: A framework for job scheduling

jopen 2014-11-17   47213   0

Hadoop数据传输工具:Sqoop 经验

Sqoop(SQL-to-Hadoop) 项目旨在协助 RDBMS 与 Hadoop 之间进行高效的大数据交流。用户可以在 Sqoop 的帮助下,轻松地把关系型数据库的数据导入到 Hadoop 与其相关的系统 (如HB

jopen 2014-12-02   18913   0

Hadoop 2.x HDFS新特性 经验

Hadoop 2.x HDFS新特性 HDFS联邦 HDFS HA(要用到zookeeper等,留在后面再讲) HDFS快照 回顾: HDFS两层模型 Namespace: 包

jopen 2015-01-13   19497   0

Hadoop初步体验(安装与测试) 经验

简述:Hadoop是最著名使用最广泛的分布式大数据处理框架,它是用Java开发的。 物理主机、虚拟机、虚拟主机这三个就不多说了。我们先在ubuntu里添加一个叫hadoop的用户 ‍ 1:安装jdk

jopen 2015-02-13   14404   0

在 Docker 上建立多节点的 Hadoop 集群 经验

上建立多节点的 Hadoop 集群 在 上篇文章 中你已经看到了在你的devbox创建一个单点Hadoop 集群是多么简单。 现在我们提高门槛,在Docker上创建一个多点hadoop集群。在开始前,确保你有最新的Ambari镜像:

jopen 2014-07-01   29523   0
P23

  Hadoop源码分析-MapReduce部分 文档

2009-02-21 Hadoop源代码分析(MapReduce概论) 大家都熟悉文件系统,在对HDFS进行分析前,我们并没有花很多的时间去介绍HDFS的背景,毕竟大家对文件系统的还是有一定的理解的,

dishad631 2010-10-01   5060   0
P12

  Hadoop 源码以及流程解析 文档

Hadoop源码以及流程解析 整体结构 DN: Configuration,JobClient,JobConf Master:JobTracker,JobInProgress,TaskInProgress

xfj3526 2012-06-13   2384   0

Elasticsearch、MongoDB和Hadoop比较 经验

引擎,它们存储着JSON文 档,MongoDB存着JSON文档,或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配置完成很多同样的事情。 ES是否可以作为一个NoSQL

jopen 2015-05-12   22864   0

hadoop作业调优参数整理及原理 经验

观。 当采用map中间结果压缩的情况下,用户还可以选择压缩时采用哪种压缩格式进行压缩,现在hadoop支持的压缩格式有:GzipCodec,LzoCodec,BZip2Codec,LzmaCode

mq2126 2016-01-21   9102   0

Hadoop和Spark框架的异同 经验

谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是停留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。 1 解决问题的层面不一样

oxzr6054 2016-09-02   14060   0

Apache Hadoop 2.0 Alpha 发布 资讯

Hadoop并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架。 Apache Hadoop 2.0 今天发布了首个 alpha 版本,该版本

jopen 2012-05-27   18210   1

Apache Hadoop 2.3.0发布 资讯

分布式计算开源框架Hadoop近日发布了今年的第一个版本Hadoop-2.3.0,新版本不仅增强了核心平台的大量功能,同时还修复了大量bug。 新版本对HDFS做了两个非常重要的增强: 支持异构的存储层次

jopen 2014-02-27   10093   0

Apache拟在Docker中运行Hadoop 资讯

Apache 在其 Hadoop 维基百科发布了一个 页面 ,主要整理了 Docker 中运行 Hadoop 的好处,以及要完全在 Docker 中运行 Hadoop 所需要完成的工作。在 Docker,或者说其它容器中运行

jopen 2014-09-04   8223   0
Hadoop   Docker  

Hunk/Hadoop: 性能最佳实践 资讯

com/cn/news/2015/09/Hunk-Performance 无论有没有使用Hunk,当运行Hadoop时,有很多种方式导致偶尔的性能底下。多数时候人们是增加更多的硬件来解决问题,但是有时候只需要简单更改下文件的名称就可以解决问题。

jopen 2015-09-28   5966   0
Hadoop  

Spark和Hadoop,孰优孰劣? 资讯

http://www.infoq.com/cn/news/2015/12/Spark-Hadoop-HDFS Spark 已经取代 Hadoop 成为最活跃的开源大数据项目。但是,在选择大数据框架时,企业不能因此就厚此薄彼。近日,著名大数据专家

jopen 2015-11-30   16341   0
Spark  
1 2 3 4 5 6 7 8 9 10