TiDB 在摩拜单车在线数据业务的应用和实践 经验

TiDB 集群的数据,在一些运营需要实时数据提供的场景,不再需要按照原有的提供数据到大数据平台,设计 ETL 方案,运营再去大数据部门沟通运算逻辑。而是直接在 TiDB 现有数据的基础上,直接提出复杂的分析需求,设计

GarfieldN40 2017-12-26   39865   0
TiDB  
P27

  Oracle Warehouse Builder11g手册 文档

R1的安装. 注意: OWB 包含以下组件: ETL Core feature: 这是随database standard edition 免费提供的核心功能, 核心ETL功能随database license提供大量核心功能

suixing 2011-11-09   477   0

文档数据库 OrientDB v2.2.8 发布 资讯

关系数据库可在几毫秒内可检索数以百记的链接文档图。 更新日志 Dates loaded via ETL using dateFormat yyyy-mm-dd in CSV extractor only

jopen 2016-08-24   9035   0

旅游推荐系统的演进 经验

同时打上label。另外可能部分特征需要在线上生产并写入样本日志中,比如:实时特征,没办法用离线ETL采集; 样本选择:对初始样本做过滤,比如:过滤最后一个点击样本之后的数据,输出还是ISample;

MMCLin 2017-03-28   12206   0
P11

  PowerCenter 安装配置指南 文档

PowerCenter是Informatica出品的数据中心管理工具集中的一个产品,主要用于设计和完成ETL过程,其中又包含多个子产品,如Data Profiling和Data Analyzer,其服务器端的架构如下:

athos1981 2013-05-09   3509   0
P7

  kettle 使用中的一些常见问题 文档

设定字段名称和数据类型 使用kettle设计一些ETL任务时一些常见问题 2009-07-27 10:55 摘要:本文主要介绍使用kettle设计一些ETL任务时一些常见问题,这些问题大部分都不在官方F

xzz168 2014-10-13   2720   0

殷鹏翔:51信用卡的日志分析变迁史和技术细节 经验

间结果 ETL、消费行为、风控和授信评分,及其他终端业务产品做数据支撑,用户数据进入金融产品。在金融产 品逐步增多的过程中,整个 ETL 过程变成最耗时、耗资源的部分。下一步在就是把 ETL 作为整体

jopen 2015-02-09   16022   0
日志  

基于 Mesos 和 Docker 构建企业级 SaaS 应用 Elasticsearch as a Service 经验

尤其是对于做运维的人来说,这些开源软件的出现, 使得运维人员对机器集群的管理,资源的管理,服务的调度管理都大大的节省了成本,也使得我们的预想成为可能。借助Mesos平台使我们提供的ES集群服务化,产品化。总的来说,我们的目标有这几点:

iceperson 2016-11-11   17915   0
Mesos   SaaS   Docker  
P339

  电子政务公共服务平台升级改造项目 文档

44 2.8.1 数据交换平台 45 2.8.2 消息中间件 47 2.8.3 数据集成中间件(ETL) 48 2.8.4 服务总线(ESB) 49 2.9 租赁服务器需求 50 3 系统总体设计 51

nettea 2016-07-21   553   0
P190

  医保合理支付信息系统需求说明书-功能描述 文档

88 1.1.10.7 业务回退(预留) 89 1.1.10.8 功能管理 90 1.1.10.9 调度日志查询 90 1.2 医院端子系统 91 1.2.1 系统组成结构 91 1.2.2 基础数据维护

731663204 2015-05-10   2655   0

2016 软件开发的七大趋势:容器技术将统治世界 资讯

。 六、ETL继续扮演沉默杀手 ETL就像厨房里的洗菜切菜工序,但却消耗了80%的数据分析预算,大厨只拿20%不到,这显然是很要命的一件事,如果门槛和成本不能 大幅下降 ,ETL将继续扮演数据分析项目的绊脚石和沉默杀手。

jopen 2015-10-19   5946   0
容器  

Hadoop平台架构 经验

impala,spark),流计算(storm,sparkstreaming)等多种类型 的作业,长ETL任务,短SQL-on-Hadoop任务,SQL-on-Hbase的实时入库查询!对内存, 网络

dongpo 2016-01-27   21195   0

基于Hadoop MapReduce模型的数据分析平台研究设计 经验

e,负责管理他所在节点上的数据存储,并负责处理文件系统客户端的读写请求, 在NameNode的统一调度下进行数据块的创建、删除和复制。集群中的数掘节点管理存储的数据,会将块的元数据存储在本地,并且会将全部存在的块信息周

d3fw 2015-04-28   48832   0
P23

  数据仓库和数据挖掘在商业活动中的应用 文档

服务器Extracting transforming & Loading(ETL)/ 数据仓库 服务器Data Mart 服务器富国银行最终用户4.8.促销活动 管理服务器ETL 流程促销对象--数据仓库选择 数据 Mart客

gaoguoren 2011-08-28   3983   0
P17

  数据仓库实施策略 文档

模型项目具体实施步骤项目前期准备 业务分析 信息分析 逻辑数据模型设计 系统体系结构设计 物理数据库设计 数据转换加载ETL 前端应用开发 数据挖掘服务 解决方案集成(测试验收与试运行) 6. 1 项目前期准备主要任务: 项目启动会议

kklion 2012-09-28   3079   0

流式SQL数据库:PipelineDB 经验

supports all other extensions too. No ETL PipelineDB eliminates the ETL layer. Stream granular data directly

jopen 2015-07-08   31516   0
P81

  Cognos入门到精通-高级知识库 文档

XML统一元数据,为应用提供统一,一致的视图元数据模型认证大量的报表OLAP报表: 管理报表, 生产报表, 报表服务: 调度,爆发高效率分析分析: OLAP 和 ROLAP 分析 和 报表OLAP Server: OLAP

cpwd 2014-02-16   3624   0
P75

  Kettle 从零开始 文档

1、了解什么是ETL工具 2、了解kettle是什么东西 3、如何使用kettle来做数据集成 第一讲: Kettle工程存储方式有两种:一种是以XML形式存储,一种是以资源库方式存储。 Kettl

Young24 2014-04-02   3524   0

Apache Kylin 综述 经验

等,同时包括REST服务器以响应客户端请求 扩展:支持额外功能和特性的插件 整合:与调度系统,ETL,监控等生命周期管理系统的整合 用户界面:在Kylin核心之上扩展的第三方用户界面 驱动:ODBC

caotans 2017-01-04   26137   0

数据仓库平台,Apache Hive 1.1.0 发布 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-03-09   12022   0
1 2 3 4 5 6 7 8 9 10