开源项目,开源代码,开源文档,开源新闻,开源社区

用户扩展表”以及“用户今天的数据快照 join 用户昨天的数据快照”这类场景可能比较合适。这里顺便说个题外话，在数据仓库中，小表往往是维度表，而小表Map join这件事情其实用udf代替还会更快，因为不用单独启动一

jopen 2015-01-14 35509 0

Hive SQL

TDW，腾讯分布式数据仓库项目，在Hadoop的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracle功能兼容的SQL语法，支持PB及的存储和TB及的计算等。这个项目主要的应用场景是

jopen 2014-03-31 34230 0

TDW 数据挖掘

版已在 4 月 1 日对外发布。在此，我们将揭露新版 SQL Server 的各个新特性，尤其是数据仓库的支持。当然，我首先还是关注新版本的定价。微软公司正在推动一种综合定价模式。这对他们来说非常重要，因为客户会把其与

jopen 2014-04-16 15396 0

SQL Server

P150

1. 数据仓库与数据挖掘原理及应用 2. 目录数据仓库基础 7. 分类和预测 数据仓库设计和实现 8. 关联分析 数据仓库实例 9. Web挖掘 OLAP和OLAM 10. 数据挖掘实例 5 . 数据挖掘基础

gaoshuc2 2013-11-10 3953 0

数据挖掘方案报告 Intel Java

为了满足挖掘分析与交互式实时查询的计算需求，腾讯大数据使用了Spark平台来支持挖掘分析类计算、交互式实时查询计算以及允许误差范围的快速查询计算，目前腾讯大数据拥有超过200台的Spark集群，并独立维护Spark和Shark分支。Spark集群已稳定运行2年，积累了大量的案例和运营经验能力，另外多个业务的大数据查询与分析应用，已在陆续上线并稳定运行。在SQL查询性能方面普遍比MapReduce高出2倍以上，利用内存计算和内存表的特性，性能至少在10倍以上。

jopen 2014-11-29 53806 0

Spark 分布式/云计算/大数据

P4

数据仓库及BI工程师面试题集锦前言 1、介绍一下项目经验、项目中的角色。一、数据库 1、 Oracle数据库，视图与表的区别？普通视图与物化视图的区别？物化视图的作用？视图是一段编译好的s

haozai 2016-11-23 1360 0

方案试题 SQL

P19

基于数据仓库的决策支持系统技术一发展概述管理信息系统（MIS）为信息处理提供强大的数据处理和存储能力。早期信息系统主要是为实现业务而建立的，根据业务的需要建立大量独立的系统。多个独立的系统

wanyunchao 2012-05-11 426 0

数据挖掘

P81

1. 数据仓库与数据挖掘综述概念、体系结构、趋势、应用报告人：朱建秋 2001年6月7日 2. 提纲数据仓库概念 数据仓库体系结构及组件 数据仓库设计 数据仓库技术（与数据库技术的区别） 数据仓库性能数据仓库应用

nn2e 2014-03-31 501 0

数据挖掘方案报告 Intel Basic

P26

1. 第11章 数据仓库和分布式应用 2. 11.1 数据仓库一、数据仓库简介 1、数据仓库的定义及特性 数据仓库就是面向主题的、集成的、不可更新的（稳定性）、随时间不断变化（不同时间）的数据集合，

fujita731 2012-12-13 2606 0

数据挖掘方案 Java SQL

用户扩展表”以及“用户今天的数据快照 join 用户昨天的数据快照”这类场景可能比较合适。这里顺便说个题外话，在数据仓库中，小表往往是维度表，而小表map join这件事情其实用udf代替还会更快，因为不用单独启动一

jopen 2014-09-01 28344 0

Hive 数据挖掘

延迟状况下同Hadoop进行交互，并且对于相同的数据。集效果优于Hive的查询多维联机分析处理数据仓库（MOLAP Cube）。用户能够定义数据模型，并且通过Kylin能够预建超过10多亿行原始数据记录的数据模型。

jopen 2014-12-02 33465 0

Kylin 数据挖掘

Facebook在数据仓库上遇到的存储可扩展性的挑战是独一无二的。我们基于Hive的数据仓库中存储了超过300PB的数据，并且以每日新增 600TB的速度增长。去年这个数据仓库所存储的数据量增长了3

jopen 2014-12-12 22458 0

数据仓库数据挖掘

P77

一、概述 Bill Inmon（数据仓库之父）在Building the Data Warehouse （John Wiley & Sons Inc., 1996）书中把数据仓库描述为一个“面向主题的、完整

zhouyg705 2014-02-10 4971 0

数据挖掘方案

在美团点评酒旅事业群内，业务由传统的团购形式转向预订、直连等更加丰富的产品形式，业务系统也在迅速的迭代变化，这些都对数据仓库的扩展性、稳定性、易用性提出了更高要求。对此，我们采取了分层次、分主题的方式，本文将分享这一过程中的一些经验。

TerL25 2017-05-27 33335 0

数据仓库美团网软件架构

Hive 是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2011-12-19 15283 0

Hive

Hive 是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

fmms 2012-02-05 11519 0

Hive

Computing 正式发布了他们的 Snowflake弹性数据仓库 。这是一款软件即服务产品，基于Amazon Web Services提供了一个SQL数据仓库。在2014年10月的一篇博文中， Curt

jopen 2015-08-01 6068 0

云数据

百度昨日正式开源 Palo ，这是一个百度自研的基于 MPP 的交互式 SQL 数据仓库，主要用于解决报表和多维分析。 Palo 主要集成了 Google Mesa 和 Cloudera Impala

jopen 2017-08-12 16492 0

Palo 百度开源

Shark 是一个大型的数据仓库系统为 Spark 的设计与 Apache Hive 兼容。它处理 Hive QL 的性能比 Apache Hive 快 30 倍。支持 Hive 查询语言、元存储、序列化格式和用户自定义函数。

jopen 2012-10-22 12686 0

Shark

P11

北京市***局项目（数据仓库） 数据仓库比较项目编号： 数据仓库比较 Oracle vs DB2 1 文档简介 3 1.1 文档目的 3 1.2 文档范围 3 1.3 缩写约定 3 1.4 参考文档和文献

hanwangabc 2012-04-08 3229 0

Oracle 数据库服务器

深入浅出数据仓库中SQL性能优化之Hive篇经验

腾讯分布式数据仓库：TDW 经验

SQL Server 2014 RTM版本中的数据仓库资讯

数据仓库与数据挖掘原理及应用v3 文档

Spark在腾讯数据仓库TDW的应用经验

个人总结的数据仓库面试题文档

基于数据仓库的决策支持系统技术文档

数据仓库与数据挖掘综述文档

数据仓库和分布式应用文档

数据仓库中的 SQL 性能优化（Hive篇）经验

Kylin：基于Hadoop的开源数据仓库OLAP分析引擎经验

Facebook的数据仓库是如何扩展到300PB的经验

数据仓库分析系统整体设计方案文档

美团点评酒旅数据仓库建设实践经验

数据仓库平台 Apache Hive 0.8.0 发布资讯

数据仓库平台 Apache Hive 0.8.1 发布资讯

Snowflake正式发布了他们的云数据仓库产品资讯

百度开源OLAP引擎Palo，高可用的MPP数据仓库资讯

数据仓库系统，Shark 0.2 发布资讯

数据仓库比较Oracle vs DB2 文档

银行数据仓库的相关搜索

关键词

深入浅出数据仓库中SQL性能优化之Hive篇 经验

腾讯分布式数据仓库：TDW 经验

SQL Server 2014 RTM版本中的数据仓库 资讯

数据仓库与数据挖掘原理及应用v3 文档

Spark在腾讯数据仓库TDW的应用 经验

个人总结的数据仓库面试题 文档

基于数据仓库的决策支持系统技术 文档

数据仓库与数据挖掘综述 文档

数据仓库和分布式应用 文档

数据仓库中的 SQL 性能优化（Hive篇） 经验

Kylin：基于Hadoop的开源数据仓库OLAP分析引擎 经验

Facebook的数据仓库是如何扩展到300PB的 经验

数据仓库分析系统整体设计方案 文档

美团点评酒旅数据仓库建设实践 经验

数据仓库平台 Apache Hive 0.8.0 发布 资讯

数据仓库平台 Apache Hive 0.8.1 发布 资讯

Snowflake正式发布了他们的云数据仓库产品 资讯

百度开源OLAP引擎Palo，高可用的MPP数据仓库 资讯

数据仓库系统，Shark 0.2 发布 资讯