P16

  MapReduce的原理 文档

MapReduce的原理 Hadoop中的MapReduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的式并 行处理上T级别的数据集。

banny 2014-04-09   285   0
P9

  HBase 技术介绍 文档

HBase技术介绍 博客分类: · Hadoop HBaseHadoopMapreduce数据结构Google From:http://www.searchtb.com/2011/01/understanding-hbase

hypermusic 2013-05-30   3005   0
P12

  1、Cloudera Manager 介绍与安装 文档

Manager (简称CM)用于管理CDH4集群,可进行节点安装、配置、服务配置等,提供Web窗口界面提高了Hadoop配置可见度,而且降低了集群参数设置的复杂度。 https://ccp.cloudera.com

lxj2008 2014-01-17   34763   0
P13

  2、Cloudera Manager 安装和环境熟悉 文档

Manager (简称CM)用于管理CDH4集群,可进行节点安装、配置、服务配置等,提供Web窗口界面提高了Hadoop配置可见度,而且降低了集群参数设置的复杂度。 https://ccp.cloudera.com

lxj2008 2014-01-17   427   0
P14

  HDFS资料整理 文档

中的mkdirs()方法,这个方法在DFSClient实例中调用同名方法mkdirs(),通过Hadoop本身的RPC机制调用Namenode的mkdirs()方法,最终这个调用PUSH到FSName

kspengjun 2011-07-26   3814   0
P3

  大数据分析的流程浅析之一:大数据采集过程分析 文档

现分布式计算的软件有很多,名气最大的,目前市场上应用最广的,就是hadoop技术了,更精确地说应该是叫hadoop框架。 hadoop框架由多种功能性软件组成,其自身只是搭建一个和操作系统打交道的平台

czh_3104 2015-07-06   608   0
P96

  MapReduce 算法设计 文档

完成了基于MapReduce的并行化比对算法研究。 14. 课程项目设计梁亚澜,李杰,钮鑫涛:Hadoop平台下覆盖表生成遗传算法参数配置启发式演化工具 李袁奎,刘文杰,王姜: 使用Mapreduce框架进行软件代码分析

bxunzhao 2013-05-18   999   0
P3

  K-Means聚类示例 文档

Mahout_examples_Data_Set中 (2) 将testdata放在hdfs的用户根目录下 user@hadoop:$hadoop dfs -cp /share/data/Mahout_examples_Data_Set/testdata

songyl525 2013-12-11   672   0
P8

  云存储平台搭建 文档

且它提供高传输率来访问应用程序的数据,适合那些有着超大数据集的应用程序。 5. Apache Hadoop 是一个软件框架(平台),它可以分布式地操纵大量数据。它于 2006 年出现,由 Google、Yahoo

hlking 2012-05-31   8583   0
P9

  HBase 技术介绍简介 NOSQL数据库 入门 文档

 HBase技术介绍简介 NOSQL数据库 入门 HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC

fyhbbs 2013-05-30   489   0
P8

  HBase 简介 文档

HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google

songyl525 2013-12-11   3157   0
P8

  HBase 技术介绍 文档

HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google

duchengli 2012-09-12   438   0
P16

  hive1.2.1安装部署说明书 文档

command卡住 可能原因:多个select命令同时排队而mapreduce只能依次执行命令 解决方法:重启hadoop或等待 16.问题:节点worker进程缺失 解决方法:进入该节点的spark的sbin目录下启动worker进程

shenxxPH 2016-12-26   680   0
数据挖掘   x86   SQL  
P8

  HBase分布式数据库 文档

HBase--分布式数据库 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

tony2007 2015-06-19   3862   0
P227

  spark学习笔记 文档

BDAS 17 4.3 Spark与Hadoop的比较 18 4.3.1 Spark与Hadoop的对比 19 4.3.2 Spark特性 20 4.3.3 Hadoop的MapReduce计算模型 20

larruping 2017-01-03   1040   0
方案   报告   Apache   Basic   diff  
P113

  云计算apache HIVE的使用 文档

概述 Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive

xnbw 2016-01-11   2024   0
P5

  写好Hive程序的五个提示 文档

这样能够保证查询的销售记录集合中,销售ID对应的数量是正确排序的,但是销售ID不能正确排序,原因是hive使用hadoop默认的HashPartitioner分发数据。 这就涉及到一个全排序的问题。解决的办法无外乎两种:

wcdw 2014-06-02   3299   0
P50

  HBase 简介 (来自京东商城) 文档

优化 HBase 用途 3. HBase简介Hadoop生态系统 4. 成员名用途Hadoop CommonHadoop体系最底层的一个模块,为Hadoop各子项目提供各种工具,如:配置文件和日志操作等。AvroAvro是doug

x32577539 2012-12-10   19742   0
P62

  HIVE 学习笔记 文档

2010-12-15 起草 陈晓军 目录 1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4

P61

  Hive 用户指南 v1.0 中文版 文档

用户指南 v1.0 目录 1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4

lxz 2014-01-03   2563   0
1 2 3 4 5 6 7 8 9 10