开源项目,开源代码,开源文档,开源新闻,开源社区

Apache Tajo 0.10.1 发布，Tajo 是一个分布式数据仓库系统，基于 Hadoop 实现，特点是低延迟、高可伸缩，提供专用查询和 ETL 工具特点：可伸缩性和低延迟完全分布式的

jopen 2015-06-30 11292 0

Apache Tajo

文 / 杨栋大数据时代的信息爆炸，使得分布式/并行处理变得如此重要。无论是传统行业，还是新兴行业（特别是互联网行业），日常业务运行所产生的海量用户和服务数据都需要更大的硬件资源来处理。需要并行

jopen 2012-05-30 18467 0

Hive

Infobright是一款基于独特的专利知识网格技术的列式数据库。Infobright是开源的MySQL数据仓库解决方案，引入了列存储方案，高强度的数据压缩，优化的统计计算(类似sum/avg/group

jopen 2014-12-02 37085 0

数据挖掘 Infobright

P45

1. 中国工商银行数据仓库建设情况汇报数据仓库项目组 10/24/20181 2. 日程安排开发进度最终应用展现 数据仓库架构10/24/20182 3. 二、开发进展2.1 个人客户关系管理（PCRM）

fujita731 2012-12-13 8805 0

数据挖掘方案报告

P7

数据仓库技术在电子商务中的应用研究学校：河南财经政法大学班级：090704 姓名：樊雷学号：20094070403 目录：摘要： 3 1.引言 3 2.在电子商务中应用数据仓库的必要性 3

1824776211 2015-04-14 1954 0

Tajo 是一个基于 Hadoop 实现的分布式数据仓库系统，特点是低延迟、高可伸缩，提供专用查询和针对存储在HDFS上的大数据集和其他数据源的ETL 工具。特点：可伸缩性和低延迟完全分布式的

jopen 2013-11-21 49163 0

数据挖掘 Apache Tajo

Infobright是一款基于独特的专利知识网格技术的列式数据库。Infobright简单易用，快速安装部署，使用中无需复杂操作，能大幅度减少管理工作；在应对50TB甚至更多数据量进行多并发复杂查询时，更能够显示出令人

jopen 2014-08-31 67307 0

数据挖掘 Infobright

做数据仓库的头两年，使用高配置单机 + MySQL的方式来实现所有的计算（包括数据的ETL，以及报表计算。没有OLAP）。用过MySQL自带的MYISAM和列存储引擎Infobright。这篇文章总结

jopen 2014-08-31 91004 0

MySQL SQL

发布，该版本包含大量新特性、改进和 bug 修复，详情请看改进记录。 Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能

fmms 2012-04-30 13948 0

Apache Hive

Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-06-29 9747 0

Apache Hive

Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

nwbg 2015-05-23 9039 0

Apache Hive

Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2016-02-16 44369 0

Apache Hive

P99

1. 数据仓库技术介绍了解你的组织了解你的客户了解你的供应商嵇晓 2. 内容提要动机与需求 数据仓库技术 数据仓库在宝钢的实践结束语 3. 面临的问题人们在日常生活中经常会遇到这样的情况：超市

suixing 2011-01-17 543 0

数据挖掘方案报告 Intel

Hive是Apache基金会下的一个在Hadoop上构建数据仓库的开源软件，它支持通过类SQL的HQL语言操作结构化数据。Hive的主要功能是将类SQL的HQL语言翻译成MapReduce代码并在H

jopen 2014-12-07 80138 0

Hive 数据挖掘

split.size指的是数据的最小分割单元大小。 Mapred.max.split.size指的是数据的最大分割单元大小。 dfs.block.size指的是HDFS设置的数据块大小。一般来说dfs

jopen 2015-01-14 35509 0

Hive SQL

TDW，腾讯分布式数据仓库项目，在Hadoop的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracle功能兼容的SQL语法，支持PB及的存储和TB及的计算等。这个项目主要的应用场景是

jopen 2014-03-31 34230 0

TDW 数据挖掘

版已在 4 月 1 日对外发布。在此，我们将揭露新版 SQL Server 的各个新特性，尤其是数据仓库的支持。当然，我首先还是关注新版本的定价。微软公司正在推动一种综合定价模式。这对他们来说非常重要，因为客户会把其与

jopen 2014-04-16 15396 0

SQL Server

为了满足挖掘分析与交互式实时查询的计算需求，腾讯大数据使用了Spark平台来支持挖掘分析类计算、交互式实时查询计算以及允许误差范围的快速查询计算，目前腾讯大数据拥有超过200台的Spark集群，并独立维护

jopen 2014-11-29 53806 0

Spark 分布式/云计算/大数据

P4

数据仓库及BI工程师面试题集锦前言 1、介绍一下项目经验、项目中的角色。一、数据库 1、 Oracle数据库，视图与表的区别？普通视图与物化视图的区别？物化视图的作用？视图是一段编译好的s

haozai 2016-11-23 1360 0

方案试题 SQL

P19

基于数据仓库的决策支持系统技术一发展概述管理信息系统（MIS）为信息处理提供强大的数据处理和存储能力。早期信息系统主要是为实现业务而建立的，根据业务的需要建立大量独立的系统。多个独立的系统

wanyunchao 2012-05-11 426 0

数据挖掘

Apache Tajo 0.10.1 发布，分布式数据仓库资讯

从数据仓库系统对比看Hive发展前景资讯

开源MySQL数据仓库解决方案：Infobright 经验

工商银行数据仓库设计方案文档

数据仓库技术在电子商务中的应用研究文档

分布式数据仓库系统：Apache Tajo 经验

开源的MySQL数据仓库解决方案：Infobright 经验

数据仓库中的 SQL 性能优化（MySQL篇）经验

数据仓库平台，Apache Hive 0.9.0 发布资讯

基于Hadoop的数据仓库平台，Apache Hive 1.2.1 发布资讯

Apache Hive 1.0.1/1.1.1 发布，数据仓库平台资讯

Apache Hive 2.0.0 发布，数据仓库平台资讯

数据仓库技术的概述、应用和发展文档

Hive在腾讯数据仓库TDW中的应用经验

深入浅出数据仓库中SQL性能优化之Hive篇经验

腾讯分布式数据仓库：TDW 经验

SQL Server 2014 RTM版本中的数据仓库资讯

Spark在腾讯数据仓库TDW的应用经验

个人总结的数据仓库面试题文档

基于数据仓库的决策支持系统技术文档

数据治理及数据仓库的相关搜索

关键词

Apache Tajo 0.10.1 发布，分布式数据仓库 资讯

从数据仓库系统对比看Hive发展前景 资讯

开源MySQL数据仓库解决方案：Infobright 经验

工商银行数据仓库设计方案 文档

数据仓库技术在电子商务中的应用研究 文档

分布式数据仓库系统：Apache Tajo 经验

开源的MySQL数据仓库解决方案：Infobright 经验

数据仓库中的 SQL 性能优化（MySQL篇） 经验

数据仓库平台，Apache Hive 0.9.0 发布 资讯

基于Hadoop的数据仓库平台，Apache Hive 1.2.1 发布 资讯

Apache Hive 1.0.1/1.1.1 发布，数据仓库平台 资讯

Apache Hive 2.0.0 发布，数据仓库平台 资讯

数据仓库技术的概述、应用和发展 文档

Hive在腾讯数据仓库TDW中的应用 经验

深入浅出数据仓库中SQL性能优化之Hive篇 经验

腾讯分布式数据仓库：TDW 经验

SQL Server 2014 RTM版本中的数据仓库 资讯

Spark在腾讯数据仓库TDW的应用 经验

个人总结的数据仓库面试题 文档

基于数据仓库的决策支持系统技术 文档

数据治理及数据仓库 的相关搜索

关键词

Apache Tajo 0.10.1 发布，分布式数据仓库资讯

从数据仓库系统对比看Hive发展前景资讯

工商银行数据仓库设计方案文档

数据仓库技术在电子商务中的应用研究文档

数据仓库中的 SQL 性能优化（MySQL篇）经验

数据仓库平台，Apache Hive 0.9.0 发布资讯

基于Hadoop的数据仓库平台，Apache Hive 1.2.1 发布资讯

Apache Hive 1.0.1/1.1.1 发布，数据仓库平台资讯

Apache Hive 2.0.0 发布，数据仓库平台资讯

数据仓库技术的概述、应用和发展文档

Hive在腾讯数据仓库TDW中的应用经验

深入浅出数据仓库中SQL性能优化之Hive篇经验

SQL Server 2014 RTM版本中的数据仓库资讯

Spark在腾讯数据仓库TDW的应用经验

个人总结的数据仓库面试题文档

基于数据仓库的决策支持系统技术文档

数据治理及数据仓库的相关搜索