P26

  数据仓库和分布式应用 文档

第11章 数据仓库和分布式应用 2. 11.1 数据仓库一、数据仓库简介 1、数据仓库的定义及特性 数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合, 用以

fujita731 2012-12-13   2606   0
数据挖掘   方案   Java   SQL  

数据仓库中的 SQL 性能优化(Hive篇) 经验

split.size指的是数据的最小分割单元大小。 mapred.max.split.size指的是数据的最大分割单元大小。 dfs.block.size指的是HDFS设置的数据块大小。 一般来说dfs

jopen 2014-09-01   28344   0

Kylin:基于Hadoop的开源数据仓库OLAP分析引擎 经验

由eBay公司开发,并且基于Hadoop提供了SQL接口和OLAP接口,能够支持TB到 PB级别的数据量。OLAP即联机分析处理,它能够帮助分析人员、管理人员或执行人员从多角度快速、一致、交互地存取信息和更加深入的了解信息。OLAP

jopen 2014-12-02   33465   0

Facebook的数据仓库是如何扩展到300PB的 经验

Facebook在数据仓库上遇到的存储可扩展性的挑战是独一无二的。我们基于Hive的数据仓库中存储了超过300PB的数据,并且以每日新增 600TB的速度增长。去年这个数据仓库所存储的数据量增长了3倍。考

jopen 2014-12-12   22458   0
P77

  数据仓库分析系统整体设计方案 文档

3、事务——业务处理过程及业务术语 23 4、主键 24 5、外键 24 四、系统结构图及业务数据流图 25 1、系统结构图 25 2、数据流图 26 五、源数据表结构 27 1、BCS系统 27 2、Cardpool系统 34

zhouyg705 2014-02-10   4971   0

美团点评酒旅数据仓库建设实践 经验

在美团点评酒旅事业群内,业务由传统的团购形式转向预订、直连等更加丰富的产品形式,业务系统也在迅速的迭代变化,这些都对数据仓库的扩展性、稳定性、易用性提出了更高要求。对此,我们采取了分层次、分主题的方式,本文将分享这一过程中的一些经验。

TerL25 2017-05-27   33335   0

数据仓库平台 Apache Hive 0.8.0 发布 资讯

Hive 是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2011-12-19   15283   0
Hive  

数据仓库平台 Apache Hive 0.8.1 发布 资讯

Hive 是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

fmms 2012-02-05   11519   0
Hive  

Snowflake正式发布了他们的云数据仓库产品 资讯

Computing 正式 发布 了他们的 Snowflake弹性数据仓库 。这是一款软件即服务产品,基于Amazon Web Services提供了一个SQL数据仓库。 在2014年10月的一篇 博文 中, Curt

jopen 2015-08-01   6068   0

百度开源OLAP引擎Palo,高可用的MPP数据仓库 资讯

百度昨日正式开源 Palo ,这是一个百度自研的基于 MPP 的交互式 SQL 数据仓库,主要用于解决报表和多维分析。 Palo 主要集成了 Google Mesa 和 Cloudera Impala

jopen 2017-08-12   16492   0
Palo   百度   开源  

数据仓库系统,Shark 0.2 发布 资讯

Shark 是一个大型的数据仓库系统为 Spark 的设计与 Apache Hive 兼容。它处理 Hive QL 的性能比 Apache Hive 快 30 倍。支持 Hive 查询语言、元存储、序列化格式和用户自定义函数。

jopen 2012-10-22   12686   0
Shark  
P11

  数据仓库比较Oracle vs DB2 文档

北京市***局项目(数据仓库数据仓库比较 项目编号: 数据仓库比较 Oracle vs DB2 1 文档简介 3 1.1 文档目的 3 1.2 文档范围 3 1.3 缩写约定 3 1.4 参考文档和文献

hanwangabc 2012-04-08   3229   0
P29

  海量数据处理的大杀器 - 腾讯分布式数据仓库(TDW) 文档

1. 海量数据处理的大杀器 ——腾讯分布式数据仓库(TDW)2012年7月腾讯公司 郭玮 2. Agenda 腾讯公司的海量数据处理平台 腾讯分布式数据仓库(TDW) TDW的技术点分享 TDW技术发展展望

andyxiemu 2012-08-13   1111   0
P4

  gartner 2016年数据仓库数据管理解决方案魔力象限-publicpptx 文档

11Gartner发布2016年数据仓库数据管理解决方案魔力象限数据仓库领域的趋势 首先,Gartner的报告表示,数据仓库的定义在演变。Gartner在报告中说:“‘数据仓库’这个词并不意味着‘关系、集

zhonghua98 2016-09-28   2411   0
方案   报告   SQL  
P25

  客户关系管理第七章数据仓库数据挖掘技术 文档

客户关系管理系统 数据仓库与知识数据仓库 数据仓库的实施 数据挖掘技术 数据仓库技术的发展 12433客户关系管理第7章 数据仓库数据挖掘技术 3. 第1节 数据仓库技术的发展 1.现代数据库技术 “数据

gaoguoren 2011-08-28   3155   0

数据环境下互联网行业数据仓库/数据平台的架构之漫谈 经验

先大概列一下互联网行业数据仓库数据平台的用途: 整合公司所有业务数据,建立统一的数据中心; 提供各种报表,有给高层的,有给各个业务的; 为网站运营提供运营上的数据支持,就是通过数据,让运营及时了解网站和产品的运营效果;

jopen 2015-10-17   110870   0
数据  

2016年携程App网络服务通道治理和性能优化实践 经验

要,过去两年来我们一直在持续优化App网络服务的性能,到今年Q2结束时基本完成了App网络服务通道治理和性能优化的阶段性目标,特此撰文总结其中的经验教训,为以后的工作打下基础。 携程App无线网络服务架构

TamelaBunde 2016-09-25   7667   0

开源项目的“贤明君主”治理模型 资讯

截然相反的是 精英治理模型 ,该模型的参与者通过对项目作出贡献并获得认可来影响项目。 项目的组织方式在 治理文档 中 说明。第二节为希望使用”贤明君主”模型并创建自己的治理文档的项目提供了模板

jopen 2015-03-20   6985   0
开源  
P4

  针对开发人员和架构师的-soa-治理 文档

一般说来,有关治理的文章讨论的主题是,随着公司在面向服务的体系结构 (SOA) 中逐渐成熟,治理所充当的角色发生的变化。企业体系结构 (EA) 小组开发治理策略和过程,而 CIO 则会组建委员会执行治理,与此

thvp 2018-01-18   634   0

微服务治理实战:服务流的自动化构建与应用 经验

在APM(应用性能管理)领域,提供了应用拓扑。它是将终端(用户),中间件(包含应用),数据库等抽象成点,用有向的连线来描述访问关系(数据交流传输的路径)。它强调端到端的流程绘制。 应用拓扑举例: 说说

liux62 2017-01-16   16081   0
1 2 3 4 5 6 7 8 9 10