Hadoop 统计文件中某个单词出现的次数 经验

org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce

jopen 2013-07-11   38600   0

一个全面的、用于Apache Hadoop数据保护的安全框架:Rhino 经验

Rhino项目是由Cloudera、Intel和Hadoop社区合力打造的一个项目。这个项目旨在为数据保护提供一个全面的安全框架。 Rhino项目为 HBase 0.98 贡献了关键的安全特性。它

jopen 2014-08-24   12421   0

你的数据根本不够大,别老扯什么Hadoop 经验

本文原名 “Don’t use Hadoop when your data isn’t that big ” ,出自有着多年从业经验的数据科学家 Chris Stucchio ,纽约大学柯朗研究所博士

jopen 2014-08-31   32528   0

hadoop作业调优参数整理及原理(主要为shuffle过程) 经验

观。 当采用map中间结果压缩的情况下,用户还可以选择压缩时采用哪种压缩格式进行压缩,现在hadoop支持的压缩格式 有:GzipCodec,LzoCodec,BZip2Codec,LzmaCod

jopen 2014-08-27   12298   0

Hadoop面试题,看看你能答对多少?答案在后面 经验

b)DataNode c)TaskTracker d)Jobtracker 4. Hadoop 作者 a)Martin Fowler b)Kent Beck c)Doug cutting

jopen 2014-12-12   31918   0

为什么 Cloudera 要创建 Hadoop 安全组件 Sentry ? 经验

的例子还可脱敏为“x-x-x”,相当于完全对外屏蔽该信息。 访问安全主要是对用户的授权进行管理。Linux/Unix系统中用户-组的读、写、执行权限管理堪称其中的经典模型。HDFS对这一概念进行了扩充,形成了更加完备的

jopen 2015-02-04   19189   0

Hadoop完全分布式模式的配置与安装 经验

接下来有可能会用到Hadoop相关的知识, 所以这几天就在Vmware里面尝试着搭建了一下. 感觉还行. 所以趁着还记得, 就写下这篇博客, 帮助自己以后回顾, 也帮助那些准备接触Hadoop的童鞋. 因为这也是自己第一次搭建Hadoop

jopen 2015-05-12   13560   0
P6

  Hadoop-1.1.2-eclipse-plugin插件编译步骤及方法 文档

Windows下编译hadoop_eclipse插件步骤. 所需运行环境 安装包. Eclipse Ant Hadoop安装包 一:解压hadoop安装包. 二:导入eclipse-plugin工程

yongning99 2014-01-13   4353   0
P10

  Hadoop 的两种开发模式介绍 文档

mod=viewthread&tid=6950&highlight=hadoop%2B%BF%AA%B7%A2%B7%BD%CA%BD 阅读导航 1插件开发 2示例运行 Hadoop的两种开发模式 一、一种是脱离集群环境的开发:

小牛牛 2015-05-26   2658   0
P13

  Hadoop+HBase集群搭建 详细手册v0.9 文档

Hadoop,ZooKeeper,HBase分布式搭建 前提准备 注: hbase的安装需要hadoop和zookeeper和hbase,生产环境下需要将zookeeper独立安装,hbase软件选

xnbw 2016-01-11   2102   0
P74

  Hadoop权威指南-中文版(前三章) 文档

目录 I 初识Hadoop 1 1.1  数据!数据 1 1.2  数据的存储和分析 3 1.3  相较于其他系统 4 1.4  Hadoop发展简史 9 1.5  Apache Hadoop项目 12 MapReduce简介 15

我是第一de 2011-10-03   3243   0

分布式计算平台 - Hadoop 发布了1.0.0版 资讯

Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数

fmms 2011-12-31   29605   1
Hadoop  

SGI 将推出 Cloudera Hadoop 数据分析集群 资讯

10月18日,来自国外媒体的报道,高性能计算机系统提供商SGI宣布计划提供运行Hadoop数据分析平台的集群。 SGI Hadoop集群将完全支持Cloudera的发行版,包括 Apache Hadoop (CDH)在SG

fmms 2011-10-18   11087   0

Microsoft大数据计划:在Hadoop上用C#编程 资讯

Windows Azure 平台之上的 Hadoop。Microsoft 官方将未来支持 Windows Azure 和 Windows Server 的 Hadoop 框架的产品套件的代号定义为“Isotope”。

openkk 2012-03-02   11339   0
Hadoop  

超越Hadoop的大数据分析之图形处理尺寸 资讯

本文翻译自《 BIG DATA ANALYTICS BEYOND HADOOP 》译者:许巧辉 另一个来自Google的重要工具,看起来超越了Hadoop MR——Pregel框架实现了图形计算(Malewicez

jopen 2014-06-01   12671   0
Hadoop  

专访:大数据群雄逐鹿 Hadoop坚持开源? 资讯

com/opinions/602-专访-大数据群雄逐鹿-hadoop坚持开源? 出身名门雅虎的Hortonworks拥有许多优秀的Hadoop架构师与源代码的贡献者,它们为Apache Hadoop项目贡献了超过80%的源代码

jopen 2015-02-05   13300   0
Hadoop  

Hue 3.7 发布,Hadoop 图形化用户界面 资讯

和 Search App 改进。 此版本现已提供 文档 和 发行说明 。包将会在下周提供( Hadoop World )。 主要改进如下: Security New Sentry App

jopen 2014-11-09   9968   0
Hadoop  

Hadoop,开发者纠结的十件事 资讯

开源数据处理平台 Hadoop 在大数据时代的今天有着非常广泛的应用。著名的大象图标遍布各行各业,从医疗记录到银行交易,从车票预定到房屋租赁,乃至很多科学数据处理,都可以见到 Hadoop 的身影。 在

jopen 2014-10-27   10794   0
Hadoop  

60款与Hadoop和大数据相关的顶级开源工具 资讯

尤其是 Apache Hadoop )堪称中流砥柱。弗雷斯特调研公司的分析师 Mike Gualtieri 最近预测,在接下来几年,“ 100% 的大公司”会采用 Hadoop 。 Market Research

jopen 2015-08-10   60740   0
Hadoop  

Apache Sqoop 1.99.6 发布,Hadoop 数据迁移 资讯

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导入到关系型数据库中。

jopen 2015-05-12   13968   0
1 2 3 4 5 6 7 8 9 10