P35

  pivotal-bigdata-suite-overview 文档

系统财务系统销售系统客服系统会员营销 Data mart/计算平台 抽取数据收集分发中心数据仓库工具与管理平台/调度系统)管理元数据(Meta Data)管理CDC资金/财务等 Data mart/模型计算平台CDCCDCCDC账户系统…

gavin_xzw 2017-04-09   10339   0
方案   报告   Apache   Intel   Go  
P150

  数据仓库与数据挖掘原理及应用v3 文档

引言 1.2 体系结构 1.3 组成 1.4 元数据 1.5 数据粒度 1.6 数据模型 1.7 ETL 4. 1.1 引言 数据仓库定义 数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。

gaoshuc2 2013-11-10   3953   0

常用的几种大数据架构剖析 经验

由于数据仓库为结构化存储,在数据从其他系统进入数据仓库这个东西,我们通常叫做ETL过程,ETL动作和业务进行了强绑定,通常需要一个专门的ETL团队去和业务做衔接,决定如何进行数据的清洗和转换。 随着异构数据源的

通过 SonarG 释放 Guardium 数据的价值 经验

SCP)复制它们。这些文件由 SonarG ETL 处理,被保存为一种方便快速简单地执行报告和分析的格式,如图 7 所示。 图 7:Guardium 收集器生成由 SonarG ETL 处理的数据 使用 SonarG

ClaJEOK 2017-03-09   26533   0
P12

  Oracle 数据库 11g 产品家族简介 文档

用是透明的。 OWB ETL选件 企业ETL(抽取,转换,加载)选件支持复杂,庞大的ETL部署。开发者通过使用该选件可以进行很深度的合作,比如维度历史保留,重用映射代码。ETL选件也可以快速的移动大量数据和业务流结构。

saintfl 2013-03-27   498   0

大数据行业5个职位方向指南 资讯

html ETL研发 随着数据种类的不断增加,企业对数据整合专业人才的需求越来越旺盛。ETL开发者与不同的数据来源和组织打交道,从不同的源头抽取数据,转换并 导入数据仓库以满足企业的需要。ETL研发,

jopen 2015-06-07   8919   0
P72

  Oracle分区技术-大批量数据操作 文档

只需要将被迁移的表空间设置为只读方式 可同时传输索引数据,避免在目的数据库中重建索引 42. 分区交换的应用--- ETL在源系统中,将需要抽取的数据以如下语句形式,抽取到建立在单独表空间上的中间表中: CREATE TABLE

chenyong860722 2012-08-21   486   0
P73

  Oracle 大批量数据处理 文档

只需要将被迁移的表空间设置为只读方式 可同时传输索引数据,避免在目的数据库中重建索引 42. 分区交换的应用--- ETL在源系统中,将需要抽取的数据以如下语句形式,抽取到建立在单独表空间上的中间表中: CREATE TABLE

yuji0228 2012-03-15   5133   0
P33

  kettle常见问题faq 文档

开源ETL工具kettle系列之常见问题 摘要:本文主要介绍使用kettle设计一些ETL任务时一些常见问题,这些问题大部分都不在官方FAQ上,你可以在kettle的论坛上找到一些问题的答案 1. Join

xzz168 2014-10-13   3126   0

分布式流式处理框架:Storm 经验

作业,这些转换从不停止,它们会持续处理到达的数据。Storm经常用于在实时分析、在线机器学习、持续计算、分布式远程调用和ETL等领域。Storm 的部署管理非常简单,而且,在同类的流式计算工具,Storm的性能也是非常出众的。

jopen 2014-12-03   27828   0

SQL Server与MySQL数据库对比 经验

供应商。SQL Server作为市场上排名第一的联机分析处理(OLAP)服务器,它包含分析服务、ETL和用于建立和管理打印和在线报表的报表服务。MySQL没有提供商业智能功能。 总体拥有成本(TCO)

jopen 2014-01-25   32714   0

日志系统之Flume采集加morphline解析 经验

morphline简介 morphline是由flume的母公司cloudera开源的一个ETL框架。它用于构建、改变基于Hadoop进行 ETL(extract、transfer、load)的流式处理程序。(值得一提

jopen 2015-11-21   30106   0

2014 年八大最热门的大数据工作 资讯

给出了2014年最热门的十大大数据工作职位(年薪): 一、ETL开发者(11-13万美元) 随着数据种类的不断增加,企业对数据整合专业人才的需求越来越旺盛。ETL开发者与不同的数据来源和组织打交道,从不同的源

jopen 2014-01-16   13983   0
P13

  Pentaho 平台搭建之初始化MySQL数据库 文档

在这个主界面就可以进行商务智能系统的基本操作了:数据加工、数据展现、数据分析等,当然客户也可以通过它运行并查看报表、运行ETL作业,创建各种报表和多维分析等。当然了,目前我是还不会使用这些操作,我还在初学中,所在项目组的小组

goodstudy 2012-08-17   7539   0
P36

  以Hadoop为核心的大数据开放平台建设 文档

Federation不断完善的生态系统SQL数据操作(Hive、Impala、Shark) 脚本语言(Pig) ETL(Flume、Sqoop) 内存计算&流计算(Impala、Shark、Storm) 工作流(oozie)运维管理工具简易的集群部署功能

w327 2015-05-25   779   0

将Hadoop作为云托管服务的优劣势分析 资讯

Common,这是一组常见的实用工具,可以通过模块来运行。这些模块还包括:Hadoop分布式文件系统(HDFS)、用于任务调度和集群资源管理的 Hadoop YARN以及Hadoop MapReduce,后者是一种基于YARN的系统,能够并行处理庞大的数据集。

jopen 2015-07-08   17533   0
Hadoop  

分布式分析引擎 Apache Kylin v1.5.2 发布 资讯

同时包括REST服务器以响应客户端请求 扩展: 支持额外功能和特性的插件 整合: 与调度系统,ETL,监控等生命周期管理系统的整合 用户界面: 在Kylin核心之上扩展的第三方用户界面

jopen 2016-05-26   26899   0
P36

  以Hadoop为核心的大数据开放平台建设 文档

Federation不断完善的生态系统SQL数据操作(Hive、Impala、Shark) 脚本语言(Pig) ETL(Flume、Sqoop) 内存计算&流计算(Impala、Shark、Storm) 工作流(oozie)运维管理工具简易的集群部署功能

ee37 2015-07-05   501   0
P42

  Rabbitmq 技术培训 文档

同步转异步,提高吞吐量, 量,平换系统的压力 · 解决事件的重发(回放) 实现现实中消息的传播方式 · 充当简单的ETL功能,数据流的分发和汇总, 通过pipeline的方法处理数据 6. 典型消息中间件的使用场景 7

liuhui_sun 2017-09-05   1803   0
P68

  Kettle 技术手册 文档

 Kettle 技术手册 Etl 介绍 ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于 金融IT 来说,经常会遇到大数据量的处理,转换,迁移,所以了解并掌握一种

xzz168 2014-10-13   653   0
1 2 3 4 5 6 7 8 9 10