开源项目,开源代码,开源文档,开源新闻,开源社区

P18

unt是Hadoop自带的一个例子，目标是统计文本文件中单词的个数。假设有如下的两个文本文件来运行WorkCount程序： Hello World Bye World Hello Hadoop GoodBye

wanghaoms 2013-03-05 3360 0

分布式/云计算/大数据

P8

，Google在处理大数据方面，果真有得天独厚的优势。下面的内容，很大部分来自这篇论文。随着Hadoop的流行，大规模的数据分析系统已经越来越普及。数据分析师需要一个能将数据“玩转”的交互式系统。如

beijixing022 2013-12-12 363 0

Go

P19

大数据学习网介绍我们的网址是：bigdatastudy.cn 我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3

ngn6 2015-08-12 775 0

分布式/云计算/大数据 Apache Java JSON Python

P18

大数据学习网介绍我们的网址是：bigdatastudy.cn 我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3

ngn6 2015-08-12 631 0

分布式/云计算/大数据 Java Python Scala

P9

Namenode启动过程分析我这里所讲的是hadoop-0.20.2-cdh3u1版本已regular方式启动时的代码流程分析。在namenode启动时会首先去构造Configuration对象

光荣复兴 2014-03-30 2154 0

分布式/云计算/大数据

P9

上宣布，他们每天的数据净增量达到了1个PB，每个礼拜需要新增1000台服务器存储这些数据。再来看看我们自己公司内部的情况，基于hadoop的云梯一群集已经达到了1400台服务器的规模，淘宝数据仓库的数据量已经达到了1PB（实际存储3

videostorm 2013-10-26 485 0

分布式/云计算/大数据

P10

部分，特别是《Mahout 实战》一书。此外，我假设读者具备 Apache Hadoop 和 Map-Reduce 范式方面的基本知识。（有关 Hadoop 的更多信息，请参阅参考资料部分。） Mahout 现状

beiwei1121 2014-09-23 492 0

机器学习 Apache

P7

大数据存储和处理技术 • Hadoop:分布式存储和计算平台 • HDFS：分布式文件系统 • MapReduce：分布式计算框架 • NOSQL：分布式数据库 • MPP、内存计算与流计算平台 •

loveqiqi 2015-05-09 693 0

分布式/云计算/大数据

P64

8. 大数据主要与大型数据集相关在大数据的新世界中，我们必须更换所有陈旧系统大数据就是 Hadoop 较为陈旧的事务数据已经不再重要数据仓库已是昨日黄花大数据适合熟知互联网的企业。传统业务与大数据毫无关系

guet_lee 2017-01-15 10670 0

分布式/云计算/大数据方案报告 Intel C/C++

P26

Hive是Hadoop项目中的一个子项目，由FaceBook向Apache基金会贡献，其中TaoBao也是其中一位使用者+贡献者，Hive被视为一个仓库工具，可以将结构化的数据文件映射为一张数据库表，并可以将sql语句转换为

hywhyw1985 2013-05-24 3884 0

分布式/云计算/大数据

P4

Ganglia的安装与配置 0 前记：之前由于Hadoop集群的搭建和数据的收集，再一次部署了Ganglia来收集系统层监测数据。虽然之前已经部署过一次，但是此次部

真不是梦 2017-01-05 1860 0

系统监控

P4

numPartitions); 函数返回对于的reduce task ID 用户也可以不提供Partitioner，这是Hadoop会使用默认的。 2.4 Combiner Combiner使得map task与reduce

gaofei8704 2013-06-19 624 0

分布式/云计算/大数据

P4

（Java私塾）MapReduce实例第一部分：什么是 MapReduce Hadoop Map/Reduce是一个使用简易的软件框架，基于它写出来的应用程序能够运行在由上千个商用机

singing 2014-01-09 2559 0

分布式/云计算/大数据

P4

numPartitions); 函数返回对于的reduce task ID 用户也可以不提供Partitioner，这是Hadoop会使用默认的。 2.4 Combiner Combiner使得map task与reduce

gaofei8704 2013-06-25 290 0

分布式/云计算/大数据

P35

管理不同类型企业数据资源的典型技术半/非结构化数据以批量结构化处理为主主要用于与结构化数据整合的大数据分析场景 Hadoop的分布式计算架构非常适合处理社交媒体、移动互联等典型的半/非结构化数据，被广泛应用于大数据领域

gavin_xzw 2017-04-09 10339 0

方案报告 Apache Intel Go

P11

操作工具类代码 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HColumnDescriptor;

beauty2003 2016-05-10 2073 0

P76

审计系统自动化运维系统Hive运行时监控系统实时分析系统可视化引擎数据监控和管理系统Hadoop Map ReduceHadoop HDFSDatax报表需求(淘数据)数据开发界面Hbase元数据中心

hans511002 2012-06-24 4302 0

分布式/云计算/大数据方案培训 HTTP Java

P4

hbase,hive,hadoop一个演示的例子。 1. 在终端上创建表；（hive） CREATE EXTERNAL TABLE MYRELATION( key INT, name STRING,telphone1

xnbw 2016-01-11 472 0

分布式/云计算/大数据

P10

/bin/hadoop fs -copyFromLocal test.log /hdfs/ 三、运行map red /bin/hadoop jar contrib/streaming/hadoop-streaming-0

gppxm 2012-10-19 449 0

分布式/云计算/大数据

P39

1安装客户端首先获得客户端软件，然后解压安装包（以下用$HADOOP_HOME代替hadoop客户端解压后的路径）： $ tar -xzvf hadoop-0.20.1-tdw-0.1-lite.tar.gz

gtimehero 2013-01-04 1102 1

数据挖掘手册

MapReduce 源码分析完整版文档

Google Dremel 原理-如何能3秒分析1PB 文档

(1)Spark简介文档

(2)Spark 基础知识文档

Namenode 启动过程分析文档

一位架构师谈海量计算存储文档

Apache Mahout：适合所有人的可扩展机器学习框架文档

大数据存储和处理技术文档

大数据智能分析解决方案介绍-ibm 文档

Hive and Hbase入门文档

ganglia的安装与配置文档

MapReduce 程序编程框架文档

MapReduce 实例文档

MapReduce 程序编程框架文档

pivotal-bigdata-suite-overview 文档

hbase 数据表介绍文档

淘宝数据开发平台介绍文档

一个hive hbase hdoop+eclipse的实例文档

MapReduce 数据分析实战文档

腾讯TDW分布式数据仓库用户手册文档

Hadoop 的相关搜索

关键词

MapReduce 源码分析完整版 文档

Google Dremel 原理-如何能3秒分析1PB 文档

(1)Spark简介 文档

(2)Spark 基础知识 文档

Namenode 启动过程分析 文档

一位架构师谈海量计算存储 文档

Apache Mahout：适合所有人的可扩展机器学习框架 文档

大数据存储和处理技术 文档

大数据智能分析解决方案介绍-ibm 文档

Hive and Hbase入门 文档

ganglia的安装与配置 文档

MapReduce 程序编程框架 文档

MapReduce 实例 文档

MapReduce 程序编程框架 文档

pivotal-bigdata-suite-overview 文档

hbase 数据表介绍 文档

淘宝数据开发平台介绍 文档

一个hive hbase hdoop+eclipse的实例 文档

MapReduce 数据分析实战 文档

腾讯TDW分布式数据仓库用户手册 文档

Hadoop 的相关搜索

关键词

MapReduce 源码分析完整版文档

(1)Spark简介文档

(2)Spark 基础知识文档

Namenode 启动过程分析文档

一位架构师谈海量计算存储文档

Apache Mahout：适合所有人的可扩展机器学习框架文档

大数据存储和处理技术文档

Hive and Hbase入门文档

ganglia的安装与配置文档

MapReduce 程序编程框架文档

MapReduce 实例文档

MapReduce 程序编程框架文档

hbase 数据表介绍文档

淘宝数据开发平台介绍文档

一个hive hbase hdoop+eclipse的实例文档

MapReduce 数据分析实战文档

腾讯TDW分布式数据仓库用户手册文档