Hadoop工具在其不断进化中披荆斩棘 资讯

大数据表。HBase擅长包括快速查找和更新超过几百万行数据集的数据管理需求。 Hive是一个数据仓库平台,支持在大量数据集合上的类SQL的查询能力,它利用Hadoop的并行架构来将一个大的数据表分

jopen 2014-12-17   9930   0
Hadoop  

统一数据分析接口,Apache Lens 2.4.0-beta 发布 资讯

储的单一视图来实现数据分析任务切分,同时优化了执行的环境。无缝的集成 Hadoop 实现类似传统数据仓库的功能。 该项目主要特性: 简单元数据层为数据存储提供抽象视图层 单一的共享模式服务器,基于

c8yy 2015-11-24   11048   0

什么是spark 经验

巧: 巧在借势和借力。Spark借Hadoop之势,与Hadoop无缝结合;接着Shark(Spark上的数据仓库实现)借了Hive的势;图计算借 用Pregel和PowerGraph的API以及PowerGr

jopen 2014-08-14   51313   0

Git入门一 经验

==============版本管理员操作======================== 第一步: 创建数据仓库 git init --bare shared.git ==============开发人员1操

jopen 2015-07-20   16629   0
P21

  Oracle9i 对 DML 和 DDL 语句的扩展 文档

..SELECT 是使用一个DML 语句向多个表中插入数据的一部分 多表INSERT 语句可作为数据仓库应用中向目标数据库传送数据的一种方法 它具有更高的效率: 避免使用多各DML 语句 使用一个DML

chengzhi0921 2012-07-13   490   0
P11

  HIVE 入门 文档

查看表结构命令 修改表 导入数据 编写HQL 自定义函数目录 3. Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在

kunshou 2012-09-13   533   0

openCRX - 专业、开源的企业级CRM解决方案 博客

定制自己的销售流程 . 你可以把任意阶段的销售合约与现有的ERP系统集成起来,并随时提供实时的数据给类似数据仓库或者货运状态等信息. 先进的活动管理和问题跟踪 在大项目中,协同工作流可以追踪并监控所有项目相

umltool 2010-11-05   2398   0

什么是GREENPLUM 经验

很快。最著名的案例就是阿里巴巴集团,经过多种产品的精心选型,最终选择GREENPLUM作为它们的数据仓库平台存放数百TB的业务数据去高效支持各种分析应用。 如何学习GREENPLUM? 正是由

CristineWil 2016-02-20   8449   0

Hadoop上时实类SQL查询系统对比 经验

类SQL实时查询系统,但是它们的侧重点完全不同。而且它们也不是为了替换Hive而生,hive在做数据仓库时还是很有价值的。 目前来说只有impala比较成熟( 人 家标称要使用CDH版本hadoo

jopen 2013-11-30   29365   0

一个高效的分布式计算系统:Spark 经验

park on YARN。Spark可以与MapReduce运行于同集群中,共享存储资源与计算,数据仓库Shark实现上借用Hive,几乎与Hive完全兼容。 Spark的适用场景 Spark是基于内

jopen 2013-11-13   53687   0

阿里云课堂第一期:DT时代,五年沉淀下的技术盛宴 资讯

阿里巴巴开发组长/高级工程师/技术专家 嘉宾介绍:从 2009 年加入阿里巴巴就开始分布式数据仓库的研发,一直战斗在 Planner、执行引擎、存储引擎的设计、实现第一线,撞墙踩坑无数,积累了丰富的第一手经验。目前工作主要集中在

jopen 2014-09-02   13776   0
P2

  OLAP与OLTP 文档

OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。 OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。 下表列出了OLTP与OLAP之间的比较:

xuzaowei 2013-06-10   1927   0
P11

  Apache Hadoop 入门第一步 文档

Chukwa:管理大型分布式系统的数据集合系统; HBase:可扩展的、分布式的数据库,以大表实现对结构化数据的存储; Hive:数据仓库基础设施,提供数据汇总(data summarization)和自主查询(ad hoc querying);

xw56 2015-04-29   366   0

两开源平台Cloudera/Hortonworks以52亿美元价格合并 资讯

补性和战略性。通过将 Hortonworks 在端到端数据管理方面的投资与 Cloudera 在数据仓库和机器学习方面的投资结合起来,我们将把业界首个企业数据云从 Edge 转移到 AI,”Reilly

jopen 2018-10-08   5356   0

云教育之微软数据平台构建业务决策分析系统 博客

员可以使用 SQL Server 2008 R2 集成服务,将大量的、分散的数据高效聚合进企业的数据仓库中。 “现在,通过 SQL Server 2008 R2 的集成服务,我们可以轻松地整合从文本文件、Excel

vivian0203 2012-03-06   1560   0

用Git子模块和Docker Compose实现高效开发工作流 经验

搭建开发环境一直让程序员们头疼,本文使用Git子模块和Docker Compose实现高效率的开发工作流,让程序员能够轻松搭建出开发环境,把精力投入到需要开发的应用本身。 问题 自我们从Continuous

jopen 2015-03-25   45038   0
P31

  《移动通信软件编程基础—java语言》第1章 文档

本章目标了解Java语言的由来及其架构划分 了解Java语言的基本特性 熟练掌握Java语言的环境搭建 掌握Java语言的程序结构 了解Java语言的编译原理 掌握Java语言的注释 3. Java语言的由来

kurui 2012-01-12   9436   0
Java开发   HTTP   HTML   Java   Go  

CI上的Web前端性能测试 经验

友好的设置,比如未压缩的JS/CSS,没有超时设置的响应等,这会导致该构建任务的 打分 不够准确。 搭建CI环境 按照传统方式,如果要搭建一个这样的CI任务,我们需要至少做这样一些事情: 安装JDK 安装Jenkins

KayleeKendr 2016-02-20   39963   0

Nginx+Keepalived实现站点高可用 经验

器宕机,另一台备机自动接管服务的效果。(nginx做反向代理,实现后端应用服务器的负载均衡) 快速搭建请直接跳至 第2节。 1. Keepalived介绍 Keepalived是一个基于VRRP协

jopen 2015-06-08   16657   0

jedisLock—redis分布式锁实现 经验

管理后台的部署架构(多台tomcat服务器+redis【多台tomcat服务器访问一台redis】+mysql【多台tomcat服务器访问一台服务器上的mysql】)就满足使用分布式锁的条件。多台服务器要访问redis全局缓存的资源

AliciaDeal 2016-10-11   13437   0
1 2 3 4 5 6 7 8 9 10