互联网公司总结的Java技术知识点 经验

MySql:InnoDB引擎;MyISAM引擎;NDB引擎;复制;索引;基本优化 数据仓库:术语;ETL;建模思路;数据量概念 Hadoop:HDFS 基础结构 主机:硬件架构;常见性能指标

jopen 2015-03-09   66997   0
技术  

一张图看懂Kettle 经验

Pentaho Kettle , 强大的PDI (ETL)工具。  · Spoon: The integrated development environment. Offers

jopen 2014-03-27   34201   0

分布式实时计算,Apache Storm 0.9.5 发布 资讯

Clojure 开发。 Storm 有很多应用场景,包括实时数据分析、联机学习、持续计算、分布式 RPC、ETL 等。Storm 速度非常快,一个测试在单节点上实现每秒一百万的组处理。 目前已经有包括阿里百

jopen 2015-06-04   16508   0
P42

  IBM DB2 DWE 方案建议书 文档

SQL仓库工具(SQL Warehouse Tool) 16 4.4. DWE管理控制台 17 4.5. DB2调度复杂即席查询的查询管理器DB2 Query Patroller 18 4.6. DB2 Cube Views

leolian 2011-01-25   5986   0
P23

  Oracle数据库健康检查与性能优化建议 文档

实施DataGuard No 应用名称 BI 应用类型OLTP/DSS/Batch DSS 开发工具 ETL -> informatical power Center Report -> MS SQL Server2008

tj459096869 2013-01-29   3933   0

Hive任务优化 经验

‘2012-07-04’; 该任务的inputdir  /group/p_sdo_data/p_sdo_data_etl/pt/popt_tbaccountcopy_mes/pt=2012-07-04 共有194个

qq3466460 2016-02-18   5840   0
P22

  敏捷商业智能 文档

探讨的话题敏捷商业智能快速发布,拥抱变化为什么?如何实现? 5. 传统商业智能的做法 数据抽取、转换、装载(ETL) 数据仓库数据集市OLAP工具, 报表工具, 仪表盘工具, 分析工具BI界面OLTP其它数据OL

zts2014 2014-10-16   2344   0

2014年值得关注的十个Hadoop大数据创业公司 资讯

流程,将Hadoop中的原始数据自动转化成可以互动的商业智能服务,无需ETL或者数据仓库。(参考阅读:Hadoop只是穷人的ETL) 二、 Alpine Data Labs 业务:提供基于Hadoop的数据分析平台

jopen 2014-04-23   28910   0
Hadoop  
P23

  GreenPlum 数据库培训资料 文档

每一块Disk的I/O资源 并行加载比串行加载,速度提高40-50倍以上,减少ETL窗口时间 增加Segment和ETL Server,并行加载速度呈线性增长 6. GREENPLUM简介 并行运算 列存储

dayong1115 2013-07-22   655   0
报告   培训   SQL  
P30

  GoldenGate 介绍 文档

TrailDeliveryDeliveryCaptureExtractTransport And Load从技术上讲: 1.ODI是ETL工具,其强项是T(Transformation),GG是数据库同步工具,其强项是E(Extract)

liubo69087 2012-09-06   4072   0
P56

  KETTLE基本知识培训 文档

主讲:韦汉靖 2. 简介 Kettle是一款国外开源的etl工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 ETL是数据抽取(Extract)、清洗(Cle

xzz168 2014-10-14   2747   0

为什么我们仍在谈论软件集成? 资讯

不需要数据映射 十几年来,数据和软件的集成都被定义成类似的 ETL (抽取 E xtract,变换 T ransform,加载 L oad)步骤。但是 ETL 天生就是受限的,因为变换(映射)的步骤需要使用一系

jopen 2014-02-06   4798   0

0x0E 大数据职位,数据场技能(上) 经验

意义上的大数据相关性不大,主要是后端开发的一系列技术,其中也会涉及分布式的一些技术。 ETL开发,ETL为Extract、Transform和Load的缩写,即数据抽取,转换与装载。将各种来源的数

gptqw89y 2016-01-29   16057   0
P18

  学习 Hive 源码 文档

2 Pig + Hive : ETL + data warehouse The data preparation phase is often known as ETL (Extract Transform

xfj3526 2012-06-13   5802   0
P44

  the log:每个程序员都应该知道有关实时数据的统一抽象 文档

这个组织的所有的服务和系统 可用。 『数据集成』还不是一个常见的用语,但是我找不到一个更好的。大家更熟知的术语ETL (译注:ETL是Extraction-Transformation-Loading的缩写,即数据提取、转换和加载)

june.zk 2016-09-12   479   0

Apache Storm 0.9.4 发布,分布式实时计算 资讯

Clojure 开发。 Storm 有很多应用场景,包括实时数据分析、联机学习、持续计算、分布式 RPC、ETL 等。Storm 速度非常快,一个测试在单节点上实现每秒一百万的组处理。 目前已经有包括阿里百

dy223 2015-03-26   17224   0

Pentaho开源部分大数据产品,移植Kettle项目到Apache 2.0许可 资讯

提供了社区套件和企业套件两个版本,社区版完全免费。 Kettle 是 Pentaho 的一个重要组成部分,是一个 ETL(Extraction-Transformation-Loading,数据提取、转换和加载)工具,

fmms 2012-02-10   17226   0
Pentaho  

分布式计算系统,Onyx 0.8.0 发布 资讯

Sqoop, Twitter Crane 等等 用途? 实时的事件流处理 连续计算 ETL 在 MapReduce 进行数据转换 数据清理 数据摄入和存储媒介传输 Onyx 0

jopen 2015-11-14   5548   0
Onyx  

推荐6款常用的Java开源报表制作工具 资讯

◆ 集成管理和开发环境:Eclipse ◆ 报表工具:Eclipse BIRT ◆ ETL工具:Enhydra/Kettle ◆ OLAP Server:Mondrian ◆ OLAP展示:JPivot

openkk 2011-10-25   89527   2
Java   报表  

分布式发布-订阅消息系统 Apache Kafka v0.10.0.1-rc1发布 资讯

它同时为发布和订阅提供高吞吐量; 它支持多订阅者,当失败时能自动平衡消费者; 它将消息持久化到磁盘,因此可用于批量消费,例如ETL,以及实时应用程序。 更新日志 [ KAFKA-2068 ] - Replace OffsetCommit

jopen 2016-08-02   17148   0
1 2 3 4 5 6 7 8 9 10