开源项目,开源代码,开源文档,开源新闻,开源社区

P120

1. 数据仓库与数据挖掘原理及应用东华理工大学理学院刘爱华 2. 目录数据仓库基础 7. 分类和预测 数据仓库设计和实现 8. 关联分析 数据仓库实例 9. Web挖掘 OLAP和OLAM 10

nn2e 2014-03-31 839 0

P81

1. 数据仓库与数据挖掘综述概念、体系结构、趋势、应用 2004年6月7日 2. 提纲数据仓库概念 数据仓库体系结构及组件 数据仓库设计 数据仓库技术（与数据库技术的区别） 数据仓库性能 数据仓库应用数据挖掘应用概述

108439162 2011-11-29 5306 0

数据挖掘方案 Intel Protocol Basic

P45

1. 中国工商银行数据仓库建设情况汇报数据仓库项目组 10/24/20181 2. 日程安排开发进度最终应用展现 数据仓库架构10/24/20182 3. 二、开发进展2.1 个人客户关系管理（PCRM）

fujita731 2012-12-13 8805 0

数据挖掘方案报告

P82

数据仓库与数据挖掘综述概念、体系结构、趋势、应用报告人：王建慧 2011年12月30日 2. 提纲数据仓库概念 数据仓库体系结构及组件 数据仓库设计 数据仓库技术（与数据库技术的区别） 数据仓库性能

w0739_wang 2012-01-11 4838 0

数据挖掘方案报告 Intel Basic

P7

数据仓库技术在电子商务中的应用研究学校：河南财经政法大学班级：090704 姓名：樊雷学号：20094070403 目录：摘要： 3 1.引言 3 2.在电子商务中应用数据仓库的必要性 3

1824776211 2015-04-14 1954 0

Tajo 是一个基于 Hadoop 实现的分布式数据仓库系统，特点是低延迟、高可伸缩，提供专用查询和针对存储在HDFS上的大数据集和其他数据源的ETL 工具。特点：可伸缩性和低延迟完全分布式的

jopen 2013-11-21 49163 0

数据挖掘 Apache Tajo

增长的客户需求以及较高的用户期望提供了全面的解决方案。 Infobright 是开源的MySQL数据仓库解决方案，引入了列存储方案，高强度的数据压缩，优化的统计计算(类似sum/avg/group by之类)，

jopen 2014-08-31 67307 0

数据挖掘 Infobright

做数据仓库的头两年，使用高配置单机 + MySQL的方式来实现所有的计算（包括数据的ETL，以及报表计算。没有OLAP）。用过MySQL自带的MYISAM和列存储引擎Infobright。这篇文章总结

jopen 2014-08-31 91004 0

MySQL SQL

发布，该版本包含大量新特性、改进和 bug 修复，详情请看改进记录。 Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能

fmms 2012-04-30 13948 0

Apache Hive

Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-06-29 9747 0

Apache Hive

Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

nwbg 2015-05-23 9039 0

Apache Hive

Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2016-02-16 44369 0

Apache Hive

P99

1. 数据仓库技术介绍了解你的组织了解你的客户了解你的供应商嵇晓 2. 内容提要动机与需求 数据仓库技术 数据仓库在宝钢的实践结束语 3. 面临的问题人们在日常生活中经常会遇到这样的情况：超市

suixing 2011-01-17 543 0

数据挖掘方案报告 Intel

P23

1. 数据仓库和数据挖掘在商业活动中的应用刘建民博士首席顾问1 2. 简介●数据仓库是公司成功的关键因素 ●随着数据的数量以指数速度增长，将原始数据转化为可供决策的信息就变得十分关键 ●这个演讲将

gaoguoren 2011-08-28 3983 0

数据挖掘方案报告演讲培训

Hive是Apache基金会下的一个在Hadoop上构建数据仓库的开源软件，它支持通过类SQL的HQL语言操作结构化数据。Hive的主要功能是将类SQL的HQL语言翻译成MapReduce代码并在H

jopen 2014-12-07 80138 0

Hive 数据挖掘

用户扩展表”以及“用户今天的数据快照 join 用户昨天的数据快照”这类场景可能比较合适。这里顺便说个题外话，在数据仓库中，小表往往是维度表，而小表Map join这件事情其实用udf代替还会更快，因为不用单独启动一

jopen 2015-01-14 35509 0

Hive SQL

TDW，腾讯分布式数据仓库项目，在Hadoop的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracle功能兼容的SQL语法，支持PB及的存储和TB及的计算等。这个项目主要的应用场景是

jopen 2014-03-31 34230 0

TDW 数据挖掘

版已在 4 月 1 日对外发布。在此，我们将揭露新版 SQL Server 的各个新特性，尤其是数据仓库的支持。当然，我首先还是关注新版本的定价。微软公司正在推动一种综合定价模式。这对他们来说非常重要，因为客户会把其与

jopen 2014-04-16 15396 0

SQL Server

P150

1. 数据仓库与数据挖掘原理及应用 2. 目录数据仓库基础 7. 分类和预测 数据仓库设计和实现 8. 关联分析 数据仓库实例 9. Web挖掘 OLAP和OLAM 10. 数据挖掘实例 5 . 数据挖掘基础

gaoshuc2 2013-11-10 3953 0

数据挖掘方案报告 Intel Java

为了满足挖掘分析与交互式实时查询的计算需求，腾讯大数据使用了Spark平台来支持挖掘分析类计算、交互式实时查询计算以及允许误差范围的快速查询计算，目前腾讯大数据拥有超过200台的Spark集群，并独立维护Spark和Shark分支。Spark集群已稳定运行2年，积累了大量的案例和运营经验能力，另外多个业务的大数据查询与分析应用，已在陆续上线并稳定运行。在SQL查询性能方面普遍比MapReduce高出2倍以上，利用内存计算和内存表的特性，性能至少在10倍以上。

jopen 2014-11-29 53806 0

Spark 分布式/云计算/大数据

数据仓库与数据挖掘原理及应用v2 文档

数据仓库和数据挖掘综述文档

工商银行数据仓库设计方案文档

数据仓库基础与数据挖掘综述文档

数据仓库技术在电子商务中的应用研究文档

分布式数据仓库系统：Apache Tajo 经验

开源的MySQL数据仓库解决方案：Infobright 经验

数据仓库中的 SQL 性能优化（MySQL篇）经验

数据仓库平台，Apache Hive 0.9.0 发布资讯

基于Hadoop的数据仓库平台，Apache Hive 1.2.1 发布资讯

Apache Hive 1.0.1/1.1.1 发布，数据仓库平台资讯

Apache Hive 2.0.0 发布，数据仓库平台资讯

数据仓库技术的概述、应用和发展文档

数据仓库和数据挖掘在商业活动中的应用文档

Hive在腾讯数据仓库TDW中的应用经验

深入浅出数据仓库中SQL性能优化之Hive篇经验

腾讯分布式数据仓库：TDW 经验

SQL Server 2014 RTM版本中的数据仓库资讯

数据仓库与数据挖掘原理及应用v3 文档

Spark在腾讯数据仓库TDW的应用经验

数据仓库生命周期工具箱的相关搜索

关键词

数据仓库与数据挖掘原理及应用v2 文档

数据仓库和数据挖掘综述 文档

工商银行数据仓库设计方案 文档

数据仓库基础与数据挖掘综述 文档

数据仓库技术在电子商务中的应用研究 文档

分布式数据仓库系统：Apache Tajo 经验

开源的MySQL数据仓库解决方案：Infobright 经验

数据仓库中的 SQL 性能优化（MySQL篇） 经验

数据仓库平台，Apache Hive 0.9.0 发布 资讯

基于Hadoop的数据仓库平台，Apache Hive 1.2.1 发布 资讯

Apache Hive 1.0.1/1.1.1 发布，数据仓库平台 资讯

Apache Hive 2.0.0 发布，数据仓库平台 资讯

数据仓库技术的概述、应用和发展 文档

数据仓库和数据挖掘在商业活动中的应用 文档

Hive在腾讯数据仓库TDW中的应用 经验

深入浅出数据仓库中SQL性能优化之Hive篇 经验

腾讯分布式数据仓库：TDW 经验

SQL Server 2014 RTM版本中的数据仓库 资讯

数据仓库与数据挖掘原理及应用v3 文档

Spark在腾讯数据仓库TDW的应用 经验

数据仓库生命周期工具箱 的相关搜索

关键词

数据仓库和数据挖掘综述文档

工商银行数据仓库设计方案文档

数据仓库基础与数据挖掘综述文档

数据仓库技术在电子商务中的应用研究文档

数据仓库中的 SQL 性能优化（MySQL篇）经验

数据仓库平台，Apache Hive 0.9.0 发布资讯

基于Hadoop的数据仓库平台，Apache Hive 1.2.1 发布资讯

Apache Hive 1.0.1/1.1.1 发布，数据仓库平台资讯

Apache Hive 2.0.0 发布，数据仓库平台资讯

数据仓库技术的概述、应用和发展文档

数据仓库和数据挖掘在商业活动中的应用文档

Hive在腾讯数据仓库TDW中的应用经验

深入浅出数据仓库中SQL性能优化之Hive篇经验

SQL Server 2014 RTM版本中的数据仓库资讯

Spark在腾讯数据仓库TDW的应用经验

数据仓库生命周期工具箱的相关搜索