基于Hadoop的数据仓库平台,Apache Hive 1.2.1 发布 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-06-29   9747   0

Apache Hive 1.0.1/1.1.1 发布,数据仓库平台 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

nwbg 2015-05-23   9039   0

Apache Hive 2.0.0 发布,数据仓库平台 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2016-02-16   44369   0
P99

  数据仓库技术的概述、应用和发展 文档

1. 数据仓库技术介绍 了解你的组织了解你的客户了解你的供应商嵇 晓 2. 内容提要动机与需求 数据仓库技术 数据仓库在宝钢的实践 结束语 3. 面临的问题人们在日常生活中经常会遇到这样的情况: 超市

suixing 2011-01-17   543   0
P23

  数据仓库和数据挖掘在商业活动中的应用 文档

1. 数据仓库和数据挖掘在商业活动中的应用刘建民 博士 首席顾问1 2. 简介●数据仓库是公司成功的关键因素 ●随着数据的数量以指数速度增长,将原始数据转化为可供决策的信息就变得十分关键 ●这个演讲将

gaoguoren 2011-08-28   3983   0

Hive在腾讯数据仓库TDW中的应用 经验

Hive是Apache基金会下的一个在Hadoop上构建数据仓库的开源软件,它支持通过类SQL的HQL语言操作结构化数据。Hive的主要功 能是将类SQL的HQL语言翻译成MapReduce代码并在H

jopen 2014-12-07   80138   0

深入浅出数据仓库中SQL性能优化之Hive篇 经验

joinkey进行join的时候,该表肯定不需要做数据重分布了,这种 功能是以HDFS作为底层文件系统的Hive所没有的。 在默认情况下,Hive的join策略是进行Reduce side joi

jopen 2015-01-14   35509   0
Hive   SQL  

腾讯分布式数据仓库:TDW 经验

TDW,腾讯分布式数据仓库项目,在Hadoop的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracle功能兼容的SQL语法,支持PB及的存储和TB及的计算等。 这个项目主要的应用场景是

jopen 2014-03-31   34230   0

SQL Server 2014 RTM版本中的数据仓库 资讯

版已在 4 月 1 日对外发布。在此,我们将揭露新版 SQL Server 的各个新特性,尤其是数据仓库的支持。 当然,我首先还是关注新版本的定价。 微软公司正在推动一种综合定价模式。这对他们来说非常重要,因为客户会把其与

jopen 2014-04-16   15396   0
P150

  数据仓库与数据挖掘原理及应用v3 文档

1. 数据仓库与数据挖掘 原理及应用 2. 目录数据仓库基础 7. 分类和预测 数据仓库设计和实现 8. 关联分析 数据仓库实例 9. Web挖掘 OLAP和OLAM 10. 数据挖掘实例 5 . 数据挖掘基础

gaoshuc2 2013-11-10   3953   0

Spark在腾讯数据仓库TDW的应用 经验

缺少对迭代计算以及DAG运算的支持 Shuffle过程多次排序和落地,MR之间的数据需要落Hdfs文件系统 Spark在很多方面都弥补了MapReduce的不足,比MapReduce的通用性更好,迭代

jopen 2014-11-29   53806   0
P4

  个人总结的数据仓库面试题 文档

数据仓库及BI工程师面试题集锦 前言 1、 介绍一下项目经验、项目中的角色。 一、 数据库 1、 Oracle数据库,视图与表的区别?普通视图与物化视图的区别?物化视图的作用? 视图是一段编译好的s

haozai 2016-11-23   1360   0
方案   试题   SQL  
P81

  数据仓库与数据挖掘综述 文档

1. 数据仓库与数据挖掘综述概念、体系结构、趋势、应用报告人:朱建秋 2001年6月7日 2. 提纲数据仓库概念 数据仓库体系结构及组件 数据仓库设计 数据仓库技术(与数据库技术的区别) 数据仓库性能 数据仓库应用

nn2e 2014-03-31   501   0
P26

  数据仓库和分布式应用 文档

1. 第11章 数据仓库和分布式应用 2. 11.1 数据仓库一、数据仓库简介 1、数据仓库的定义及特性 数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,

fujita731 2012-12-13   2606   0
数据挖掘   方案   Java   SQL  

数据仓库中的 SQL 性能优化(Hive篇) 经验

join key进行join的时候,该表肯定不需要做数据重分布了,这种功能是以HDFS作为底层文件系统的hive所没有的。 在默认情况下,hive的join策略是进行reduce side joi

jopen 2014-09-01   28344   0

Kylin:基于Hadoop的开源数据仓库OLAP分析引擎 经验

延迟状况下同Hadoop进行交互,并且对于相同的数据。集效果优于Hive的查询 多维联机分析处理数据仓库(MOLAP Cube)。用户能够定义数据模型,并且通过Kylin能够预建超过10多亿行原始数据记录的数据模型。

jopen 2014-12-02   33465   0

Facebook的数据仓库是如何扩展到300PB的 经验

Facebook在数据仓库上遇到的存储可扩展性的挑战是独一无二的。我们基于Hive的数据仓库中存储了超过300PB的数据,并且以每日新增 600TB的速度增长。去年这个数据仓库所存储的数据量增长了3

jopen 2014-12-12   22458   0

美团点评酒旅数据仓库建设实践 经验

,业务系统也在迅速的迭代变化,这些都对数据仓库的扩展性、稳定性、易用性提出了更高要求。对此,我们采取了分层次、分主题的方式,本文将分享这一过程中的一些经验。 技术架构 随着美团点评整体的系统架构调

TerL25 2017-05-27   33335   0

数据仓库平台 Apache Hive 0.8.0 发布 资讯

Hive 是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2011-12-19   15283   0
Hive  

数据仓库平台 Apache Hive 0.8.1 发布 资讯

Hive 是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

fmms 2012-02-05   11519   0
Hive  
1 2 3 4 5 6 7 8 9 10