Apache Tajo 0.10.1 发布,分布式数据仓库 资讯

Apache Tajo 0.10.1 发布,Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具 特点: 可伸缩性和低延迟 完全分布式的

jopen 2015-06-30   11292   0

数据仓库系统对比看Hive发展前景 资讯

文 / 杨栋 大数据时代的信息爆炸,使得分布式/并行处理变得如此重要。无论是传统行业,还是新兴行业(特别是互联网行业),日常业务运行所产生的海量用户 和服务数据都需要更大的硬件资源来处理。需要并行

jopen 2012-05-30   18467   0
Hive  

开源MySQL数据仓库解决方案:Infobright 经验

Infobright是一款基于独特的专利知识网格技术的列式数据库。Infobright是开源的MySQL数据仓库解决方案,引入了列存储方 案,高强度的数据压缩,优化的统计计算(类似sum/avg/group

jopen 2014-12-02   37085   0
P45

  工商银行数据仓库设计方案 文档

1. 中国工商银行 数据仓库建设 情况汇报数 据 仓 库 项 目 组 10/24/20181 2. 日程安排开发进度 最终应用展现 数据仓库架构10/24/20182 3. 二、 开发进展2.1 个人客户关系管理(PCRM)

fujita731 2012-12-13   8805   0
P7

  数据仓库技术在电子商务中的应用研究 文档

 数据仓库技术在电子商务中的应用研究 学校:河南财经政法大学 班级:090704 姓名:樊 雷 学号:20094070403 目录: 摘要: 3 1.引言 3 2.在电子商务中应用数据仓库的必要性 3

1824776211 2015-04-14   1954   0

分布式数据仓库系统:Apache Tajo 经验

Tajo 是一个基于 Hadoop 实现的分布式数据仓库系统,特点是低延迟、高可伸缩,提供专用查询和针对存储在HDFS上的大数据集和其他数据源的ETL 工具。 特点: 可伸缩性和低延迟 完全分布式的

jopen 2013-11-21   49163   0

开源的MySQL数据仓库解决方案:Infobright 经验

Infobright是一款基于独特的专利知识网格技术的列式数据库。Infobright简单易用,快速安装部署,使用中无需复杂操作,能大幅度减少管理工作;在应对50TB甚至更多数据量进行多并发复杂查询时,更能够显示出令人

jopen 2014-08-31   67307   0

数据仓库中的 SQL 性能优化(MySQL篇) 经验

数据仓库的头两年,使用高配置单机 + MySQL的方式来实现所有的计算(包括数据的ETL,以及报表计算。没有OLAP)。用过MySQL自带的MYISAM和列存储引擎Infobright。这篇文章总结

jopen 2014-08-31   91004   0
MySQL   SQL  

数据仓库平台,Apache Hive 0.9.0 发布 资讯

发布,该版本包含大量新特性、改进和 bug 修复,详情请看 改进记录 。 Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能

fmms 2012-04-30   13948   0

基于Hadoop的数据仓库平台,Apache Hive 1.2.1 发布 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-06-29   9747   0

Apache Hive 1.0.1/1.1.1 发布,数据仓库平台 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

nwbg 2015-05-23   9039   0

Apache Hive 2.0.0 发布,数据仓库平台 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2016-02-16   44369   0
P99

  数据仓库技术的概述、应用和发展 文档

1. 数据仓库技术介绍 了解你的组织了解你的客户了解你的供应商嵇 晓 2. 内容提要动机与需求 数据仓库技术 数据仓库在宝钢的实践 结束语 3. 面临的问题人们在日常生活中经常会遇到这样的情况: 超市

suixing 2011-01-17   543   0

Hive在腾讯数据仓库TDW中的应用 经验

Hive是Apache基金会下的一个在Hadoop上构建数据仓库的开源软件,它支持通过类SQL的HQL语言操作结构化数据。Hive的主要功 能是将类SQL的HQL语言翻译成MapReduce代码并在H

jopen 2014-12-07   80138   0

深入浅出数据仓库中SQL性能优化之Hive篇 经验

split.size指的是数据的最小分割单元大小。 Mapred.max.split.size指的是数据的最大分割单元大小。 dfs.block.size指的是HDFS设置的数据块大小。 一般来说dfs

jopen 2015-01-14   35509   0
Hive   SQL  

腾讯分布式数据仓库:TDW 经验

TDW,腾讯分布式数据仓库项目,在Hadoop的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracle功能兼容的SQL语法,支持PB及的存储和TB及的计算等。 这个项目主要的应用场景是

jopen 2014-03-31   34230   0

SQL Server 2014 RTM版本中的数据仓库 资讯

版已在 4 月 1 日对外发布。在此,我们将揭露新版 SQL Server 的各个新特性,尤其是数据仓库的支持。 当然,我首先还是关注新版本的定价。 微软公司正在推动一种综合定价模式。这对他们来说非常重要,因为客户会把其与

jopen 2014-04-16   15396   0

Spark在腾讯数据仓库TDW的应用 经验

为了满足挖掘分析与交互式实时查询的计算需求,腾讯大数据使用了Spark平台来支持挖掘分析类计算、交互式实时查询计算以及允许误差范围的快速查 询计算,目前腾讯大数据拥有超过200台的Spark集群,并独立维护

jopen 2014-11-29   53806   0
P4

  个人总结的数据仓库面试题 文档

数据仓库及BI工程师面试题集锦 前言 1、 介绍一下项目经验、项目中的角色。 一、 数据库 1、 Oracle数据库,视图与表的区别?普通视图与物化视图的区别?物化视图的作用? 视图是一段编译好的s

haozai 2016-11-23   1360   0
方案   试题   SQL  
P19

  基于数据仓库的决策支持系统技术 文档

基于数据仓库的决策支持系统技术 一 发展概述 管理信息系统(MIS)为信息处理提供强大的数据处理和存储能力。 早期信息系统主要是为实现业务而建立的,根据业务的需要建立大量独立的系统。 多个独立的系统

wanyunchao 2012-05-11   426   0
1 2 3 4 5 6 7 8 9 10