P5

  开源项目 Kettle 介绍 文档

 说到ETL开源项目,Kettle当属翘首,因此,偶决定花点时间了解一下。  项目名称很有意思,水壶。按项目负责人Matt的说法:把各种数据放到一个壶里,然后呢,以一种你希望的格式流出。呵呵,外国人都很有联想力。   看了提供的文档,然后对发布程序的简单试用后,可以很清楚得看到Kettle的四大块:   Chef——工作(job)设计工具(GUI方式)   Kitchen——工作(job)执行器(命令行方式)   Spoon——转换(transform)设计工具(GUI方式)   Span——转换(trasform)执行器(命令行方式)   嗯,厨师已经在厨房里,勺子和盘子一应俱全,且看能做出如何的大餐?   一:Chef——工作(job)设计器   这是一个GUI工具,操作方式主要通过拖拖拉拉,勿庸多言,一看就会。 

kalaamong 2013-01-05   8279   0
P33

  开源ETL工具kettle系列之常见问题 文档

摘要:本文主要介绍使用kettle设计一些ETL任务时一些常见问题,这些问题大部分都不在官方FAQ上,你可以在kettle的论坛上找到一些问题的答案1. Join我得到A数据流(不管是基于文件或数据库),A包含field1,field2,field3字段,然后我还有一个B数据流,B包含field4,field5,field6,我现在想把它们‘加’起来,应该怎么样做.这是新手最容易犯错的一个地方,A数据流跟B数据流能够Join,肯定是它们包含joinkey,joinkey可以是一个字段也可以是多个字段。

kalaamong 2013-01-05   326   0
P24

  Pentaho BI Server 配置手册 文档

这里所指的默认数据库,是 Pentaho自身运行所需的数据源,默认是使用hsqldb。该数据库与用来做分析的源数据是完全不相关的。Pentaho是一个以工作 流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案,侧重于大 中型企业应用。它允许商业分析人员或开发人员创建报表,仪表盘,分析模型,商业规则和 BI 流程。[1]   pentaho是世界上最流行的开源商务智能软件,以工作流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它是一个基于java平台的商业智能(Business Intelligence,BI)套件,之所以说是套件是因为它包括一个web server平台和几个工具软件:报表,分析,图表,数据集成,数据挖掘等,可以说包括了商务智能的方方面面。   Pentaho是一个它偏向于与业务流程相结合的BI解决方案,侧重于大 中型企业应用。它允许商业分析人员或开发人员创建报表,仪表盘,分析模型,商业规则和 BI 流程。

kalaamong 2013-01-05   21751   0
P39

  DataStage8.5 函数大全 文档

类型转换函数用于更改参数的类型。 以下函数位于表达式编辑器的“类型转换”类别中。方括号表示参数是可选的。缺省日期格式为 %yyyy-%mm-%dd。 以下示例按照 Transformer 阶段的“派生”字段中所示来显示这些函数。

cstj0505 2013-01-04   3628   0
P7

  软件测试报告w 文档

本文档适用于XX软件的单元/集成测试。1.2系统概述1.3文档概述本文档用于对XX软件的测试工作阶段成果的描述。包括对软件测试的整体描述,软件测试的分类和级别,软件测试的过程描述,软件测试的结果等内容。2引用文档《XX软件需求规格说明》《XX软件设计说明》《XX系统接口协议》3测试概述3.1被测软件的基本概况使用的编程语言:XXX汇编语言程序行数:1590子程序个数:11单行注释行数:669注释率:约为42%3.1.1.测试小结本次测试对XX软件进行了静态分析和动态测试。测试工作分为两个阶段。第一阶段进行了软件静态分析,软件测试人员和开发人员分别对软件V1.00版本的代码进行走读。

Lcc丶魔神 2013-01-04   6762   0
P9

  Session 服务器配置指南与使用经验 文档

摘要所有Web程序都会使用Session保存数据.使用独立的Session服务器可以解决负载均衡场景中的Session共享问题.本文介绍.NET平台下建立Session服务器的几种办法,并介绍在使用Session时的各种经验和技巧。二.关于Session,SessionID和Cookies Session数据保存在服务器端但是每一个客户端都需要保存一个SessionID,SessionID保存在Cookies中,关闭浏览器时过期.在向服务器发送的HTTP请求中会包含SessionID,服务器端根据SessionID获取获取此用户的Session信息.

xuwei_lovely 2013-01-04   3876   0
P5

  apache与IIS共享80端口解决方案 文档

最近我们单位受兄弟单位委托帮其开发了一个网站,网站采用的是PHP技术开发的,网站是通过apache发布的。当网站开发完成后,准备把网站部署到单位服务器的时候碰到了预想不到的问题,apache与服务器已有的IIS发生了80端口,通过apache发布的网站不能被访问。我们通过查找相关资料,经过自己的努力总算解决了apache与IIS共享80端口冲突的问题。下面我就简单介绍我们是如何解决这个问题的。

happyzhlb 2013-01-04   3948   0
P16

  js在火狐和IE浏览器的差异 文档

以下以 IE 代替 Internet Explorer,以 MF 代替 Mozzila Firefox 1. document.form.item 问题 (1)现有问题: 现有代码中存在许多 document.formName.item("itemName") 这样的语句,不能在 MF 下运行 (2)解决方法: 改用 document.formName.elements["elementName"] (3)其它

happyzhlb 2013-01-04   2424   0
P2

  安装Eclipse SVN plugin 文档

这里介紹Eclipse的SVN Plugin,叫做Subclipse,官方网站的下载地址在http://subclipse.tigris.org/,也提供了update site http://subclipse.tigris.org/update。

baisonghh 2013-01-04   4658   0
P4

  Hadoop-0.20.2连接MySQL 文档

一、背景为了方便Mapreduce直接访问关系型数据库(Mysql,Oracle),Hadoop提供了DBInputFormat和DBOutputFOrmat两个类。通过DBInputFormat类把数据库表数据读入到HDFS,根据DBOutputFormat类把Mapreduce产生的结果集导入到数据库表。

baisonghh 2013-01-04   4610   0
P3

  报告软件测试错误的规范 文档

报告软件测试错误的目的是为了保证修复错误的人员可以重复报告的错误,从而有利于分析错误产生的原因,定位错误,然后修正之。因此,报告软件测试错误的基本要求是准确、简洁、完整、规范。需要掌握的报告技术归纳如下。

Lcc丶魔神 2013-01-04   1747   0
P7

  农信历史查询系统性能测试分析报告 文档

农信历史查询系统的这一“测试计划”文档,有助于实现以下预定目标: <br>1、确定现有项目的信息和应测试的页面。 <br>2、列出采用的测试方案,并对这些方案加以说明。 <br>3、确定所需的资源,并对测试的工作量进行估计。 <br>4、列出测试项目的可交付元素。

Lcc丶魔神 2013-01-04   530   0
P44

  信息门户系统压力测试报告 文档

<华南师范大学数字校园信息门户系统>压力测试报告。本测试报告是通过由LoadRunner工具对信息门户系统的学校内部门户登录、注销等功能进行并发测试结果来分析多个用户同时访问、登录、注销时的响应时间是否达到用户需求,是否能支持3000用户同时登录访问学校内部门户,并且登录平均时间是否在10秒以内,系统是否存在其他性能问题。 阅读对象:项目经理、开发人员、测试人员、客户代表

Lcc丶魔神 2013-01-04   6385   0
P1

  mysql_oracle_java_数据类型对照 文档

mysql_oracle_java_数据类型对照

cy7667155 2013-01-04   3425   0
P11

  pgAdmin III 简明手册 文档

 pgadmin 是一个设计,维护和管理 Postgres 数据库用的通用工具。 它能在各种平台的Windows,Linux,FreeBSD,Mac和Solaris服务器上使用。 特性包括: 任意 SQL 语句。 可用于数据库,表,索引,序列,视图,触发器, 函数和语言的浏览器和'构造器'。用户,组和权限配置对话框。 带有升级脚本生成功能的版本跟踪。Microsoft MSysConf 表的配置。

wtwt 2013-01-04   29928   0
P24

  javaweb系列之四(url和reqeuest和response转发与重定向) 文档

URLConnection/ServletContext对象介绍 request/response/验证码/三个域对象/页面跳转技术

wangjianme 2013-01-04   3750   0
P25

  javaweb系列之三(javabean内省beanutils类加载器servlet及生命周期) 文档

JavaBean/内省/BeanUtils/类加载器 Servlet/Servlet的生命周期/ServletContext对象介绍

wangjianme 2013-01-04   2552   0
P39

  腾讯TDW分布式数据仓库用户手册 文档

TDW数据仓库采用分布式存储和分布式计算的方法,利用多台主机协同运算以存储和处理大规模数据。TDW提供了原有的数据仓库系统所难以提供的近乎线性的扩展能力,随着业务和数据规模的增长,可以通过增加节点数扩大系统规模。在对TDW系统中的数据进行处理时,用户可以使用SQL语言和过程语言,方便用户进行海量数据的管理与分析。<br>TDW数据仓库需要提供海量数据(PB级)的存储能力和大数据量(TB级)的计算能力。这就要求TDW尽可能的进行分布式存储和并行执行计算操作,从而提高性能和可扩展性。 TDW的存储和计算引擎都采用share-nothing(SN)结构,SN意味着更少的竞争,这样就可以获得更好的线性扩展能力。随着业务量和数据量的增长,增加节点就可以提高整个系统的存储和计算能力。SN结构是支持分布式存储和并行计算的最优结构,具有共享资源少、系统开销小、加速比高等优点和近似线性的可扩充性,符合TDW分布式数据仓库的设计要求。

gtimehero 2013-01-04   1102   1
P4

  云计算层次架构(浪潮计算机 王洪亮) 文档

 云计算层次架构如图所示。其中云基础设施即服务(IaaS)、云平台即服务(PaaS)、云软件即服务(SaaS)是云计算的三种服务模式。   硬件设备位于云计算架构的底层,是云计算平台的基础。由于数据中心常会同时采购不同厂家的多种设备,且新老设备共存,所以该领域的显著特点就是会存在大量异构的设备资源。

gtimehero 2013-01-04   659   0
P18

  发送邮件及邮件附件java代码实例(支持多附件) 文档

发送邮件及邮件附件java代码实例(支持多附件)

hbh520678 2013-01-04   1632   0
1 2 3 4 5 6 7 8 9 10

关键词

最新上传

热门文档