开源项目,开源代码,开源文档,开源新闻,开源社区

P5

《××项目业务需求说明书》一、引言 1. 编写目的这部分内容说明文档编写目的，描述本系统特点及其使用数据仓库技术实现的业务目标。 2. 背景这部分内容是项目背景描述，介绍本项目启动的要求及实施项目双方的情况等。

winner008 2011-08-18 419 0

P4

e,查询相对较少的系统）。 Useful for data warehousing （OLIP）数据仓库，查询系统等较少做数据修改的系统。二、逻辑角度： 1.single column or

wyz88901 2012-11-17 2066 0

Oracle 数据库服务器

P2

多数据源，数据库怎么分布的。 2，做ETL的那台机器放在哪，操作系统和硬件环境是什么。 3，目标数据仓库的数据库是什么，操作系统，硬件环境。 4，数据库的字符集怎么选，数据传输方式是什么，开发环境。

wbb0509 2013-09-23 2824 0

P18

联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的. OLAP是数据仓库系统的主要应用，支持复杂的分析操作，侧重决策支持，并且提供直观易懂的查询结果。 2. OLAP逻

lrz1969329 2016-11-21 542 0

方案 SQL

P3

同的数据库用户； 2、表空间可以把表空间作为单元执行部分备份和部分恢复任务； 3、由于像数据仓库分区表这样的大对象可以分布在几个表空间上，因此，可以使表空间横跨好几个硬盘和控制器，以便提高性能；

iverson198 2014-03-06 2303 0

Oracle 数据库服务器

P18

10. settings.xml详解 7 11. maven常用命令 11 11.1 改变本地的数据仓库目录 11 11.2 文件安装命令 11 11.3 清除产生的项目 11 11.4 创建一个工程

ma_chenbin 2010-12-22 6011 0

Maven 项目构建

package, 系统报错说没有找到依赖 6. 需要重新构建Hello第一个项目并安装到数据仓库, 在命令行Hello根目录下执行mvn clean install 7. 重新在HelloFriend目录下执行命令mvn

jopen 2014-07-22 21353 0

Maven 项目构建

维团队很有用。以上几点，就决定了Splunk的市场非常的大，这家公司的概念是流式数据领域的数据仓库，2012在纳斯达克上市，不过这两年被人做空，股票大跌。因为很多云计算厂商都能提供这种服务，例如阿里云1MB/S都是免费的。

jopen 2014-09-01 102970 0

Splunk

SequenceFile ， rcfile 由于列式存储方式，数据加载时性能消耗较大，但是具有较好的压缩比和查询响应。数据仓库的特点是一次写入、多次读取，因此，整体来看， rcfile 相比其余两种格式具有较明显的优势。

jopen 2015-12-29 9440 0

分布式/云计算/大数据

HBase 已用于内部监视系统、Nearby Friends 功能、索引查询、流数据分析以及为内部数据仓库抓取数据。 HBase 可靠性在 Facebook 通常会出现这样一个情况，选择一个潜

jopen 2014-06-09 7710 0

Facebook

P5

Memory存储引擎（之前称为HEAP 存储引擎），将表中的数据存放在内存中。它非常适合用于存储临时数据的临时表，以及数据仓库的纬度表，它默认使用哈希索引，而不是我们数据的B+树索引。速度非常快，但表锁，并发性能较差，并且不支持TEXT

css0613 2012-09-05 3090 0

MySQL 数据库服务器 SQL

P5

project Explorer 中出现 DFS locations ，此时即可看到hadoop数据仓库中的文件夹及文件了，如图：同时也可以在此界面上做文件新建上传删除操作等等。 D．配置hadoop环境

TmRobust 2012-01-09 573 0

Hadoop 分布式/云计算/大数据

Hadoop/Spark 集群来运行你的深度学习应用，然后将其动态地共享给其它工作负载（如 ETL、数据仓库、特征工程、经典机器学习、图分析等等）。如何使用 BigDL？要学习如何在 Linux

jopen 2017-01-16 23127 0

深度学习分布式系统大数据

销售人员喜欢说“读模式”，但事实上，要取得成功，你必须清楚的了解自己的用例将是什么(Hive模式不会看起来与你在企业数据仓库中所做的不一样)。真实的原因是一个数据湖比Teradata和Netezza公司有更强的水平扩展性

jopen 2016-02-04 10075 0

Hadoop Spark

。同时它也对内容仓库做出了自己的定义，它认为内容仓库是一个高级的信息管理系统，该系统是是传统的数据仓库的扩展，它提供了诸如版本控制、全文检索，访问控制，内容分类、访问控制、内容事件监视等内容服务。更新日志

jopen 2016-05-17 9036 0

历程做过介绍。2009 到 2011 年的第一代平台主要目标是规模化，形成了 TDW（腾讯分布式数据仓库）这样的架构；2012 到 2014 年第二代平台主要是实时化，把大规模计算搬到平台上，支持了实时性强、规模大的业务需求，但是基于

jopen 2017-06-19 19782 0

腾讯

深入代码后便发现了问题所在。原来每周都会执行一次某个定时任务，它会启动一系列的后台线程。这些线程会提取数据并进行转换然后存储到数据仓库中。转换规则是配置在XML里的，这些线程会通过javax.xml.parsers.Documen

jopen 2015-03-05 14914 0

Java开发 java类

据库的主要作用还是为了实时查询，如果一个存储数据的系统检索数据的速度很慢，那么这个系统应该称之为数据仓库，hbase是一种数据库，是一种用来弥补传统关系数据库在海量数据中快速检索数据的能力不足。不过受

jopen 2016-01-06 11968 0

HBase 数据库 NoSQL数据库

P7

据集系统 HBase: 一个可扩展的，分布的数据库，支持对大表的结构化数据的存储 Hive:一个数据仓库的基础设施，提供数据汇总和特定查询。 Mahout:一个可扩展的机器学习和数据挖掘库 Pig:

xsh1019 2013-01-05 3560 0

Hadoop 分布式/云计算/大数据

P30

MapReduce框架并行数据分析语言Pig 列存储NoSQL数据库 Hbase 分布式协调器Zookeeper 数据仓库Hive(使用SQL) Hadoop日志分析工具ChukwaHadoop生态系统 11. 11Data

lxz 2014-01-03 3863 0

Hadoop 分布式/云计算/大数据方案 SQL Go

《××项目业务需求说明书》文档

oracle index学习总结文档

学习Kettle遇到的问题文档

rolap的概念文档

Oracle 数据库的结构文档

Maven学习文档

Maven安装与配置经验

Splunk初体验——像Google那样搜索你的数据经验

Hadoop 2.6 + Hive 1.2.1 + spark-1.4.1(3) 经验

将宕机时间缩减到5分钟，Facebook揭露下一代数据存储资讯

MySQL学习文档文档

Eclipse开发hadoop程序文档

英特尔开源分布式深度学习库BigDL：支持高性能大数据分析资讯

7种常见的hadoop和spark项目资讯

Java内容仓库API，Apache Jackrabbit Oak v1.2.15 发布资讯

腾讯正式开源高性能分布式计算平台Angel1.0，追赶同行脚步资讯

Java类加载与锁经验

Hbase学习笔记01 经验

Hadoop 的一周学习心得文档

淘宝Hadoop与数据分析文档

数据仓库的相关搜索

关键词

《××项目业务需求说明书》 文档

oracle index学习总结 文档

学习Kettle遇到的问题 文档

rolap的概念 文档

Oracle 数据库的结构 文档

Maven学习 文档

Maven安装与配置 经验

Splunk初体验——像Google那样搜索你的数据 经验

Hadoop 2.6 + Hive 1.2.1 + spark-1.4.1(3) 经验

将宕机时间缩减到5分钟，Facebook揭露下一代数据存储 资讯

MySQL学习文档 文档

Eclipse开发hadoop程序 文档

英特尔开源分布式深度学习库BigDL：支持高性能大数据分析 资讯

7种常见的hadoop和spark项目 资讯

Java内容仓库API，Apache Jackrabbit Oak v1.2.15 发布 资讯

腾讯正式开源高性能分布式计算平台Angel1.0，追赶同行脚步 资讯

Java类加载与锁 经验