P18

  MapReduce 源码分析完整版 文档

unt是Hadoop自带的一个例子,目标是统计文本文件中单词的个数。假设有如下的两个文本文件来运行WorkCount程序: Hello World Bye World Hello Hadoop GoodBye

wanghaoms 2013-03-05   3360   0
P8

  Google Dremel 原理-如何能3秒分析1PB 文档

,Google在处理大数据方面,果真有得天独厚的优势。下面的内容,很大部分来自这篇论文。 随着Hadoop的流行,大规模的数据分析系统已经越来越普及。数据分析师需要一个能将数据“玩转”的交互式系统。如

beijixing022 2013-12-12   363   0
Go  
P19

  (1)Spark简介 文档

大数据学习网介绍我们的网址是:bigdatastudy.cn 我们提供专业的大数据学习视频,包括Hadoop,Spark,Storm,Mahout,机器学习等。 我们定价合理,让每个人都学得起大数据。 3

ngn6 2015-08-12   775   0
P18

  (2)Spark 基础知识 文档

大数据学习网介绍我们的网址是:bigdatastudy.cn 我们提供专业的大数据学习视频,包括Hadoop,Spark,Storm,Mahout,机器学习等。 我们定价合理,让每个人都学得起大数据。 3

ngn6 2015-08-12   631   0
P9

  Namenode 启动过程分析 文档

Namenode启动过程分析 我这里所讲的是hadoop-0.20.2-cdh3u1版本已regular方式启动时的代码流程分析。 在namenode启动时会首先去构造Configuration对象

光荣复兴 2014-03-30   2154   0
P9

  一位架构师谈海量计算存储 文档

上宣布,他们每天的数据净增量达到了1个PB,每个礼拜需要新增1000台服务器存储这些数据。 再来看看我们自己公司内部的情况,基于hadoop的云梯一群集已经达到了1400台服务器的规模,淘宝数据仓库的数据量已经达到了1PB(实际存储3

videostorm 2013-10-26   485   0
P10

  Apache Mahout:适合所有人的可扩展机器学习框架 文档

部分,特别是《Mahout 实战》 一书。此外,我假设读者具备 Apache Hadoop 和 Map-Reduce 范式方面的基本知识。(有关 Hadoop 的更多信息,请参阅 参考资料 部分。) Mahout 现状

beiwei1121 2014-09-23   492   0
P7

  大数据存储和处理技术 文档

大数据存储和处理技术 • Hadoop:分布式存储和计算平台 • HDFS:分布式文件系统 • MapReduce:分布式计算框架 • NOSQL:分布式数据库 • MPP、内存计算与流计算平台 •

loveqiqi 2015-05-09   693   0
P64

  大数据智能分析解决方案介绍-ibm 文档

8. 大数据主要与大型数据集相关 在大数据的新世界中,我们必须更换所有陈旧系统 大数据就是 Hadoop 较为陈旧的事务数据已经不再重要 数据仓库已是昨日黄花 大数据适合熟知互联网的企业。传统业务与大数据毫无关系

guet_lee 2017-01-15   10670   0
P26

  Hive and Hbase入门 文档

 Hive是Hadoop项目中的一个子项目,由FaceBook向Apache基金会贡献,其中TaoBao也是其中一位使用者+贡献者,Hive被视为一个仓库工具,可以将结构化的数据文件映射为一张数据库表,并可以将sql语句转换为

hywhyw1985 2013-05-24   3884   0
P4

  ganglia的安装与配置 文档

Ganglia的安装与配置 0  前记:        之前由于Hadoop集群的搭建和数据的收集,再一次部署了Ganglia来收集系统层监测数据。        虽然之前已经部署过一次,但是此次部

真不是梦 2017-01-05   1860   0
P4

  MapReduce 程序编程框架 文档

numPartitions); 函数返回 对于的reduce task ID 用户也可以不提供Partitioner,这是Hadoop会使用默认的。 2.4 Combiner Combiner使得map task与reduce

gaofei8704 2013-06-19   624   0
P4

  MapReduce 实例 文档

(Java私塾)MapReduce实例 第一部分: 什么是 MapReduce               Hadoop Map/Reduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机

singing 2014-01-09   2559   0
P4

  MapReduce 程序编程框架 文档

numPartitions); 函数返回 对于的reduce task ID 用户也可以不提供Partitioner,这是Hadoop会使用默认的。 2.4 Combiner Combiner使得map task与reduce

gaofei8704 2013-06-25   290   0
P35

  pivotal-bigdata-suite-overview 文档

管理不同类型企业数据资源的典型技术半/非结构化数据以批量结构化处理为主 主要用于与结构化数据整合的大数据分析场景 Hadoop的分布式计算架构非常适合处理社交媒体、移动互联等典型的半/非结构化数据,被广泛应用于大数据领域

gavin_xzw 2017-04-09   10339   0
方案   报告   Apache   Intel   Go  
P11

  hbase 数据表介绍 文档

操作工具类代码 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HColumnDescriptor;

beauty2003 2016-05-10   2073   0
P76

  淘宝数据开发平台介绍 文档

审计系统自动化运维系统Hive运行时 监控 系统 实时分析系统可视化引擎数据 监控 和 管理 系统Hadoop Map ReduceHadoop HDFSDatax报表需求(淘数据)数据开发界面Hbase元数据中心

hans511002 2012-06-24   4302   0
P4

  一个hive hbase hdoop+eclipse的实例 文档

hbase,hive,hadoop一个演示的例子。 1. 在终端上创建表;(hive) CREATE EXTERNAL TABLE MYRELATION( key INT, name STRING,telphone1

xnbw 2016-01-11   472   0
P10

  MapReduce 数据分析实战 文档

/bin/hadoop fs -copyFromLocal test.log /hdfs/ 三、运行map red /bin/hadoop jar contrib/streaming/hadoop-streaming-0

gppxm 2012-10-19   449   0
P39

  腾讯TDW分布式数据仓库用户手册 文档

1安装客户端 首先获得客户端软件,然后解压安装包(以下用$HADOOP_HOME代替hadoop客户端解压后的路径): $ tar -xzvf hadoop-0.20.1-tdw-0.1-lite.tar.gz

gtimehero 2013-01-04   1102   1
1 2 3 4 5 6 7 8 9 10