DataCleaner 3.5.5 发布,数据质量分析 资讯

DataCleaner 是一个数据质量分析工具,可让您进行数据分析,验证和模拟类似ETL的任务。这些活动可以帮助您管理和监控数据质量,以确保您的数据是有用的,适用于您的业务情况。它可用于主数据管理(M

jopen 2013-09-25   5668   0

Enhydra Octopus 开源项目

Octopus是一个基于Java的ETL工具(数据抽取:Extract、转换:Transform、装载:Load)。它可以连接任何JDBC数据源并通一个XML文件完成数据转换。一个loadjob生成器提供从现存的数据库中生成Octopus

码头工人 2019-01-17   8586   0

分布式实时计算系统:Apache Storm 经验

很简单,可用于任意编程语言。 Storm 有很多应用场景,包括实时数据分析、联机学习、持续计算、分布式 RPC、ETL 等。Storm 速度非常快,一个测试在单节点上实现每秒一百万的组处理。 目前已经有包括阿里百

jopen 2014-09-30   27716   0
P92

  Pentaho Solutions 文档

JFreeReport Subreporting 42 连接共享 43 打印 44 调度 44 Misfires 45 Triggers 47 Secure Filter

pktangshao 2010-12-23   420   0
P38

  hbase-总结 文档

/jdk-6u45-linux-x64.bin   [2]添加Java环境变量(用户:etl) 修改“/home/etl/.bash_profile”,加上以下三句配置: export JAVA_HOME=/usr/share/java_1

moshco 2017-02-06   626   0
P32

  商业智能(BI) 文档

后经过抽取 (Extraction)、转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的 一个全局视图,在此基础上利用合适的查询和分

ggyi2003 2011-08-03   707   0

你们是不是很缺大数据工程师? 资讯

熟悉大数据领域,会 MapReduce、kafka、hadoop、storm、spark,熟悉 ETL,对若干 NoSQL 了解熟悉,能够进行平台搭建,平台开发,能够进行数据处理,会分类、聚类、用户画像、个性化推荐各种算法。

jopen 2015-12-22   27073   0

MapReduce 模式、算法和用例(MapReduce Patterns, Algorithms, and Use Cases) 经验

数据密集型计算,包括物理和工程仿真,数值分析,性能测试等等。接下来是一组算法,通常用于日志分析、ETL和数据查询,包括计数及求和,数据整理(基于特定函数),过滤,解析,验证和排序。 第二大部分是关

openkk 2012-02-24   103805   0

在敏捷世界中使用 Rational 工具执行自动化的功能测试 经验

的一个实例存储数据。数据通过 IBM 信息总线(企业服务总线)或 IBM InfoSphere DataStage® ETL 作业传入系统中,这些作业直接从源系统数据库读取数据或处理平面文件。 功能和系统测试在

bzsb6629 2016-11-28   30366   0

分布式发布-订阅消息系统 Apache Kafka v0.10.0.1发布 资讯

它同时为发布和订阅提供高吞吐量; 它支持多订阅者,当失败时能自动平衡消费者; 它将消息持久化到磁盘,因此可用于批量消费,例如ETL,以及实时应用程序。 下载 Source code (zip) Source code (tar

jopen 2016-08-08   13349   0

数据库开发工具,Aqua Data Studio 12.0 发布 资讯

ODBC。 该版本增加了FluidShell(Unix和SQL命令行Shell混合与ETL和自动化集成支持SQ命令的执行),提升大数据性能(在查询窗口中增加大结果集操作的速度,表数据编辑器

jopen 2012-10-21   23014   0
IDE  

快速的数据操作框架:Hydro 经验

|---------| = | Extract | | APP/Web | |--------| ===ETL===> . = | Transform | =====> | Server | =====> |

jopen 2015-03-05   9766   0
Hydro  

基于Hadoop的数据仓库平台,Apache Hive 1.2.1 发布 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-06-29   9747   0

Apache Hive 1.0.1/1.1.1 发布,数据仓库平台 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

nwbg 2015-05-23   9039   0

文档数据库 OrientDB v2.2.5 发布 资讯

Unable to store data to the database using orient db etl bug Stuck on "Creating delta backup of database"

jopen 2016-07-20   6859   0

分布式计算系统,Onyx 0.8.4 发布 资讯

Sqoop, Twitter Crane 等等 用途? 实时的事件流处理 连续计算 ETL 在 MapReduce 进行数据转换 数据清理 数据摄入和存储媒介传输 来自:

jopen 2016-01-16   5865   0

分布式发布-订阅消息系统 Apache Kafka v0.10.0.1-rc2发布 资讯

它同时为发布和订阅提供高吞吐量; 它支持多订阅者,当失败时能自动平衡消费者; 它将消息持久化到磁盘,因此可用于批量消费,例如ETL,以及实时应用程序。 下载 Source code (zip) Source code (tar

jopen 2016-08-04   11179   0

数据仓库平台 Apache Hive 0.8.0 发布 资讯

Hive 是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2011-12-19   15283   0
Hive  

数据仓库平台 Apache Hive 0.8.1 发布 资讯

Hive 是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

fmms 2012-02-05   11519   0
Hive  

BI套件 Pentaho 4.5 发布 资讯

◆ 集成管理和开发环境:Eclipse ◆ 报表工具:Eclipse BIRT ◆ ETL工具:Enhydra/Kettle ◆ OLAP Server:Mondrian ◆ OLAP展示:JPivot

fmms 2012-04-26   13673   0
BI  
1 2 3 4 5 6 7 8 9 10