数据仓库平台,Apache Hive 1.1.0 发布 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-03-09   12022   0

Apache Tajo 0.10.1 发布,分布式数据仓库 资讯

Apache Tajo 0.10.1 发布,Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具 特点: 可伸缩性和低延迟 完全分布式的

jopen 2015-06-30   11292   0

数据仓库系统对比看Hive发展前景 资讯

目前应用最广泛的当属 Facebook 开源贡献的 Hive。Hive 是一个基于 Hadoop 的数据仓库平台,通过 Hive,可以方便地进行数据提取转化加载(ETL)的工作。Hive 定义了一个类似于

jopen 2012-05-30   18467   0
Hive  
P41

  《数据仓库与数据挖掘》(分类规则) 文档

:在Irvine机器学习知识库中,最大可以允许的数据集仅仅为700KB,2000条记录。而现代的数据仓库动辄存储几个G-Bytes的海量数据。用以前的方法是显然不行的。 (2)为了处理大数据集或连续量

opengzmaq 2017-03-02   2514   0
P14

  浅谈数据仓库中的元数据管理技术 文档

浅谈数据仓库中的元数据管理技术 孙力君 仇道霞 方峻峰 宋楠 山东省烟草公司信息中心 摘要:数据仓库是数据库的发展方向之一, 对企业管理和决策支持起着重要的辅助作用。简要介绍了数据仓库和元数据的基本

haozai 2016-11-24   473   0
P120

  数据仓库与数据挖掘原理及应用v2 文档

1. 数据仓库与数据挖掘 原理及应用东华理工大学 理学院 刘爱华 2. 目录数据仓库基础 7. 分类和预测 数据仓库设计和实现 8. 关联分析 数据仓库实例 9. Web挖掘 OLAP和OLAM 10

nn2e 2014-03-31   839   0
数据挖掘   Intel   Java   SQL   XML  
P81

  数据仓库和数据挖掘综述 文档

1. 数据仓库与数据挖掘综述概念、体系结构、趋势、应用 2004年6月7日 2. 提纲数据仓库概念 数据仓库体系结构及组件 数据仓库设计 数据仓库技术(与数据库技术的区别) 数据仓库性能 数据仓库应用 数据挖掘应用概述

108439162 2011-11-29   5306   0
P45

  工商银行数据仓库设计方案 文档

1. 中国工商银行 数据仓库建设 情况汇报数 据 仓 库 项 目 组 10/24/20181 2. 日程安排开发进度 最终应用展现 数据仓库架构10/24/20182 3. 二、 开发进展2.1 个人客户关系管理(PCRM)

fujita731 2012-12-13   8805   0
P82

  数据仓库基础与数据挖掘综述 文档

数据仓库与数据挖掘综述概念、体系结构、趋势、应用报告人:王建慧 2011年12月30日 2. 提纲数据仓库概念 数据仓库体系结构及组件 数据仓库设计 数据仓库技术(与数据库技术的区别) 数据仓库性能

w0739_wang 2012-01-11   4838   0
P7

  数据仓库技术在电子商务中的应用研究 文档

 数据仓库技术在电子商务中的应用研究 学校:河南财经政法大学 班级:090704 姓名:樊 雷 学号:20094070403 目录: 摘要: 3 1.引言 3 2.在电子商务中应用数据仓库的必要性 3

1824776211 2015-04-14   1954   0

分布式数据仓库系统:Apache Tajo 经验

Tajo 是一个基于 Hadoop 实现的分布式数据仓库系统,特点是低延迟、高可伸缩,提供专用查询和针对存储在HDFS上的大数据集和其他数据源的ETL 工具。 特点: 可伸缩性和低延迟 完全分布式的

jopen 2013-11-21   49163   0

数据仓库平台,Apache Hive 0.9.0 发布 资讯

发布,该版本包含大量新特性、改进和 bug 修复,详情请看 改进记录 。 Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能

fmms 2012-04-30   13948   0

基于Hadoop的数据仓库平台,Apache Hive 1.2.1 发布 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-06-29   9747   0

Apache Hive 1.0.1/1.1.1 发布,数据仓库平台 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

nwbg 2015-05-23   9039   0

Apache Hive 2.0.0 发布,数据仓库平台 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2016-02-16   44369   0
P99

  数据仓库技术的概述、应用和发展 文档

1. 数据仓库技术介绍 了解你的组织了解你的客户了解你的供应商嵇 晓 2. 内容提要动机与需求 数据仓库技术 数据仓库在宝钢的实践 结束语 3. 面临的问题人们在日常生活中经常会遇到这样的情况: 超市

suixing 2011-01-17   543   0
P23

  数据仓库和数据挖掘在商业活动中的应用 文档

1. 数据仓库和数据挖掘在商业活动中的应用刘建民 博士 首席顾问1 2. 简介●数据仓库是公司成功的关键因素 ●随着数据的数量以指数速度增长,将原始数据转化为可供决策的信息就变得十分关键 ●这个演讲将

gaoguoren 2011-08-28   3983   0

Hive在腾讯数据仓库TDW中的应用 经验

Hive是Apache基金会下的一个在Hadoop上构建数据仓库的开源软件,它支持通过类SQL的HQL语言操作结构化数据。Hive的主要功 能是将类SQL的HQL语言翻译成MapReduce代码并在H

jopen 2014-12-07   80138   0

深入浅出数据仓库中SQL性能优化之Hive篇 经验

用户扩展表”以及“用户今天的数据快照 join 用户昨天的数据快照”这类场景可能比较合适。 这里顺便说个题外话,在数据仓库中,小表往往是维度表,而小表Map join这件事情其实用udf代替还会更快,因为不用单独启动一

jopen 2015-01-14   35509   0
Hive   SQL  

腾讯分布式数据仓库:TDW 经验

TDW,腾讯分布式数据仓库项目,在Hadoop的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracle功能兼容的SQL语法,支持PB及的存储和TB及的计算等。 这个项目主要的应用场景是

jopen 2014-03-31   34230   0
1 2 3 4 5 6 7 8 9 10