P11

  HBase 存储架构 文档

以设置这个标志:Put.writeToWAL(boolean)。WAL log文件是一个标准的Hadoop SequenceFile(现在还在讨论是否应该把文件格式改成一个更适合HBase的格式)。在

dutianmin 2012-08-27   4513   0
P11

  Hive理论 Hive-基于Map-Reduce框架的数据仓库解决方案 文档

intelligence),海量数据的搜集和分析发展尤为迅速,意味着使用传统的数据仓库解决方案会变得极其昂贵。Hadoop是一个流行的开源框架,实现了map-reduce,使用普通硬件就能对海量数据进行存储和处理。然

xnbw 2016-01-12   526   0
P28

  基于协同过滤的商品推荐引擎 文档

SDC 插码分析 WEB LOG 分析 syslog 10. 二、底层平台-Hadoop/mapreduce Hadoop是一个分布式系统基础架构,由Apache基金会开发用户可以在不了解分布式底层细

hellokitty 2013-01-18   868   0
方案   Apache   HTTP   SQL   Go  
P13

  Nagios介绍以及安装 文档

linux-server host_name server-80 contact_groups hadoop_group#使用自己定义的联系人组 alias slave-80 address 10.2.1

小牛牛 2015-03-24   535   0
P9

  构建Apache Mahout 文档

3)配置环境变量 图21-8:安装Maven配置环境变量 执行set命令,可以查到HADOOP_ CONF_DIR和HADOOP_HOME已经配置好。 图21-9:安装Maven配置好的环境变量 执行bin/mahout

css0613 2011-05-13   5186   0
P5

  Yarn 源代码分析 文档

来,一直利用业余时间学习hadoop生态系统的相关技术,学习的方式主要是跟踪业界大神的博客以及hadoop官方的文档,自己也利用公司淘汰下来的机器搭建了一个简单的hadoop集群来测试。当学习完系统架

光荣复兴 2014-03-30   2574   0
P15

  Hive 文档 文档

1. Hive 2. hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点

vito2 2013-11-07   539   0
P9

  大数据之惑 文档

2/MainStage/GregBattas_Hadoop_Relational_Database.pdf) 简单来说,这种处理方式基本就是把Hadoop和其它各类NewSQL,NoSQL方案以ETL

songyl525 2013-12-11   1649   0
P25

  NoSQL 研究及选型报告 文档

MapReduce 由Google提出的一种编程模式,用于大规模数据的并行运算。 l HDFS hadoop的分布式文件系统,源自Google的Google File System。 l Column Family/CF(列族、列簇)

xfei365 2014-01-03   623   0
P2

  MapReduce 编程模型 文档

的中间结果,得到最终结果。简单地说,MapReduce就是"任务的分解与结果的汇总"。   在Hadoop中,用于执行MapReduce任务的机器角色有两个:一个是JobTracker;另一个是Tas

hadooper 2013-05-30   1983   0
P15

  HBase 简介与实践分享 文档

HBase Features(Cont.)和Hadoop无缝集成 Hadoop分析后的结果可直接写入HBase; 存放在HBase的数据可直接通过Hadoop来进行分析。 11. HBase能用于Online场景吗?Why

zhpboy 2013-10-12   2979   0
P43

  企业大数据解决方案v1.3 文档

Corporation第 25 页泽佳大数据应用主要技术— Hadoop 据IDC的预测,全球大数据市场2015年 将达170亿美元规模,市场发展前景很大。而Hadoop作为新一代的架构和技术,因为有利于并行分布处理

guet_lee 2017-01-12   711   0
P45

  云计算探索与应用 文档

主线内核的虚拟化技术。 35. Hadoop HDFS ->GFS分布式文件系统 35 36. Hadoop HDFS ->GFS分布式文件系统(read) 36 37. Hadoop HDFS ->GFS分布式文件系统(write) 37

koujianbocuit 2012-06-12   673   0
P24

  ZooKeeper 简介 文档

1)单机模式   首先,从Apache官方网站下载一个ZooKeeper 的最近稳定版本。 http://hadoop.apache.org/zookeeper/releases.html   作为国内用户来说,

forward51 2012-11-13   716   0
P27

  ZooKeeper 系列讲座_很全面 文档

1)单机模式   首先,从Apache官方网站下载一个ZooKeeper 的最近稳定版本。 http://hadoop.apache.org/zookeeper/releases.html   作为国内用户来说,

dedw 2016-01-05   354   0
P31

  第三章:MapReduce 分布式计算系统 文档

函数在其他语言中也是存在的,并不是Hadoop的专利。 Hadoop中的Map和Reduce 在Hadoop中,map函数位于内置类org.apache.hadoop.mapreduce.Mapper

beat_it 2013-11-16   1837   0
P18

  深入浅出解析大数据平台架构 文档

目录: · 什么是大数据 · Hadoop介绍-HDFS、MR、Hbase · 大数据平台应用举例-腾讯 · 公司的大数据平台架构 “就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大

guet_lee 2017-01-12   1828   0
P6

  hbase获取不同版本 文档

HBase import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration;

acmers2008 2016-10-20   4550   0
P4

  Hive QL 详解 文档

Java私塾Hive QL详解 第一部分:Hadoop 计算框架的特性 什么是数据倾斜 •由于数据的不均衡原因,导致数据分布不均匀,造成数据大量的集中到一点,造成数据热点 Hadoop框架的特性 •不怕数据大,怕数据倾斜

suunny 2014-01-09   1564   0
P10

  分布式计算(Map/Reduce) 文档

分布式式计算,同样是一个宽泛的概念,在这里,它狭义的指代,按Google Map/Reduce框架所设计的分布式框架。在Hadoop中,分布式文件系统,很大程度上,是为各种分布式计算需求所服务的。我们说分布式文件系统就是加了分

wanboy 2012-09-03   642   0
1 2 3 4 5 6 7 8 9 10