hadoop hive sql语法详解 经验

the map phase through the script /bin/cat (like hadoop streaming). Similarly - streaming can be used on

openkk 2012-02-14   44168   0

Hadoopy: 使用Cython实现Python对Hadoop的封装 经验

Hadoopy是Hadoop Streaming的一个Python封装,采用Cython开发。它简单,快速,并且易于被修改。它已经在超过700个节点的集群中测试过了。Hadoopy的目标是: Similar

jopen 2013-01-11   24807   0

hadoop HDFS 的PHP扩展:phdfs 经验

phdfs是一个采用C语言的实现的PHP扩展,能够使用PHP来操作Hadoop HDFS文件系统。示例: port = "9000";

jopen 2014-08-02   43024   0

Hadoop 安全机制认证---Kerberos 经验

1. 背景 在Hadoop1.0.0或者CDH3 版本之前, hadoop并不存在安全认证一说。默认集群内所有的节点都是可靠的,值得信赖的。用户与HDFS或者M/R进行交互时并不需要进行验证。导致存在恶意用

jopen 2014-10-29   17181   0

配置高可用的Hadoop平台 经验

概述 在Hadoop2.x之后的版本,提出了解决单点问题的方案--HA(High Available 高可用)。这篇博客阐述如何搭建高可用的HDFS和YARN,执行步骤如下: 创建hadoop用户 安装JDK

jopen 2015-02-26   38061   0

Hadoop RPC使用方法示例 经验

定义RPC协议 import java.io.IOException; import org.apache.hadoop.ipc.VersionedProtocol; /**  * DateTime: 2014年12月28日 上午9:32:12

码头工人 2014-12-29   18619   0

述说我的Hadoop成长路线 经验

Hadoop启蒙 还在实验室时,老师就建议看google关于大数据的三篇论文,啃了好长时间还是没完全理解。也动手搭建Hadoop集群,运行了wordcount,带着“Hadoop会火“的指示离开了实验室。

jopen 2015-03-11   29845   0

Hadoop 压缩实现分析 经验

Hadoop 作为一个较通用的海量数据处理平台,每次运算都会需要处理大量数据,我们会在 Hadoop 系统中对数据进行压缩处理来优化磁盘使用率,提高数据在磁盘和网络中的传输速度,从而提高系统处理数据的

hbnyb 2016-01-21   21499   0

Hadoop平台架构 经验

来自: http://www.itweet.cn/2016/01/25/Hadoop-Disk-Planning/ 文章目录 1. 简介 2. 走向分布式 3. 存储规划 4. HDFS目录规划 4

dongpo 2016-01-27   21195   0

10个Hadoop的应用场景 问答

谁在用 Hadoop 这是个问题。在大数据背景下,Apache Hadoop 已经逐渐成为一种标签性,业界对于这一开源分布式技术的了解也在不断加深。但谁才是 Hadoop 的最大用户呢?首先想到的当然是它的“发源地”

jopen 2012-07-12   41501   1
Hadoop   ci   C/C++   Go   HTML  
P23

  Hadoop 任务调度器-董西成 文档

Hadoop任务调度器演讲人:董西成 技术博客:dongxicheng.org sina微博:西成懂 2. 提纲基础知识 Hadoop调度流程 Hadoop自带调度器介绍 编写自己的Hadoop调度器

gppxm 2012-10-19   6598   0
P21

  云计算架构 Hadoop 文档

1. 云计算架构Hadoop为商业打开数据之门 2. 1Hadoop是什么?开源软件工业标准硬件IT成本降低 3. 2 2004年,Google发表论文,向全世界介绍了MapReduce。 2005年

altila 2012-06-12   745   0
P230

  Hadoop之HBase从入门到精通 文档

HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google

ijamesbond 2015-03-17   6869   0

Hadoop HDFS文件操作的Java代码 经验

apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path;

jopen 2013-07-11   84118   0

Hadoop批处理调度器 Azkaban 经验

Azkaban是个简单的批处理调度器,用来构建和运行Hadoop作业或其他脱机过程。 项目主页: http://www.open-open.com/lib/view/home/1339233539396

openkk 2012-06-09   16216   0

Hadoop五分钟入门指南 经验

原文见: http://blog.josedacruz.com/2013/12/09/hadoop-in-5-minutes-for-beginners/#.Uqhs3_Q6Cjt 如果你有大量的

jopen 2013-12-12   21448   0

Hadoop中MapReduce框架入门 经验

le提出,主要用于搜索领域,解决海量数据的计算问题.对于业 界的大数据存储及分布式处理系统来说Hadoop2提出的新MapReudce就是YARN: A framework for job scheduling

jopen 2014-11-17   47213   0

Hadoop数据传输工具:Sqoop 经验

Sqoop(SQL-to-Hadoop) 项目旨在协助 RDBMS 与 Hadoop 之间进行高效的大数据交流。用户可以在 Sqoop 的帮助下,轻松地把关系型数据库的数据导入到 Hadoop 与其相关的系统

jopen 2014-12-02   18913   0

Hadoop 2.x HDFS新特性 经验

Hadoop 2.x HDFS新特性 HDFS联邦 HDFS HA(要用到zookeeper等,留在后面再讲) HDFS快照 回顾: HDFS两层模型 Namespace: 包

jopen 2015-01-13   19497   0

Hadoop初步体验(安装与测试) 经验

简述:Hadoop是最著名使用最广泛的分布式大数据处理框架,它是用Java开发的。 物理主机、虚拟机、虚拟主机这三个就不多说了。我们先在ubuntu里添加一个叫hadoop的用户 ‍ 1:安装jdk

jopen 2015-02-13   14404   0
1 2 3 4 5 6 7 8 9 10