P11

  Apache Hadoop 入门第一步 文档

Chukwa:管理大型分布式系统的数据集合系统; HBase:可扩展的、分布式的数据库,以大表实现对结构化数据的存储; Hive:数据仓库基础设施,提供数据汇总(data summarization)和自主查询(ad hoc querying);

xw56 2015-04-29   366   0

两开源平台Cloudera/Hortonworks以52亿美元价格合并 资讯

补性和战略性。通过将 Hortonworks 在端到端数据管理方面的投资与 Cloudera 在数据仓库和机器学习方面的投资结合起来,我们将把业界首个企业数据云从 Edge 转移到 AI,”Reilly

jopen 2018-10-08   5356   0

云教育之微软数据平台构建业务决策分析系统 博客

员可以使用 SQL Server 2008 R2 集成服务,将大量的、分散的数据高效聚合进企业的数据仓库中。 “现在,通过 SQL Server 2008 R2 的集成服务,我们可以轻松地整合从文本文件、Excel

vivian0203 2012-03-06   1560   0
P50

  大数据及相关技术介绍 文档

已经远远超越了目前人力所能处理的范畴 大数据时代正在来临.. 5. 认识大数据20世纪90年代,数据仓库之父的Bill Inmon就经常提及Big Data 2011年5 月,在“云计算相遇大数据” 为主题的会议中,会议

lxj2008 2014-01-19   13806   0

多形态MVC式Web架构的分类 经验

of Record)中的源数据、源文档、源文件和原始信号,以及所有把它们同步和聚集到一起的过程。模型数据仓库的存储形式已从小型 软盘 发展到 RDBMS 和 MMDBMS (多模数据库管理系统,multi-model

ioij1064 2016-10-26   7864   0
P68

  SQL Server 2008 监控与调优解决方案 文档

对特殊的属性值进行索引 对指定分区的值进行索引 常见场合 产品目录 仅对热门商品的属性进行索引 数据仓库 仅对最近三个月的销售订单进行索引 仓储系统 仅对未标记为空的商品进行索引 18. 筛选索引的工

sasafeng 2012-05-31   3850   0
P68

  SQL Server 2008 R2 监控与调优解决方案 文档

对特殊的属性值进行索引 对指定分区的值进行索引 常见场合 产品目录 仅对热门商品的属性进行索引 数据仓库 仅对最近三个月的销售订单进行索引 仓储系统 仅对未标记为空的商品进行索引 18. 筛选索引的工

qq20070139 2014-04-03   4345   0
P104

  数据挖掘技术与关联规则挖掘算法研究(博士论文) 文档

…………………………… 28 目录 2.5.2 关系型数据库中的数据挖掘 ………………… ………28 2.5.3 数据仓库中的数据挖掘 ……………………… ………30 2.5.4 在关系模型基础上发展的新型数据库中的数据挖掘

liuxl 2011-11-16   751   0
P46

  GreenPlum 数据库集群安装说明及使用手册v1.0 文档

44 7.2 更新操作中的若干问题 44 1 体系结构介绍 Greenplum数据库产品——下一代数据仓库引擎和分析方法 Greenplum公司是企业数据云计算解决方案的创始人,为客户提供灵活的数据商业

88909803 2013-01-16   750   0
P30

  Message Broker基本概念和基础架构 文档

taUpdate)节点、数据删除(DataDelete)节点、数据库(Database)节点以及数据仓库(Warehouse)节点。这些节点都专门用来访问数据库并对数据库进行操作的,所有这些节点都拥有

congz119 2011-06-03   5980   0
P9

  一位架构师谈海量计算存储 文档

再来看看我们自己公司内部的情况,基于hadoop的云梯一群集已经达到了1400台服务器的规模,淘宝数据仓库的数据量已经达到了1PB(实际存储3PB);B2B的数据仓库的数据量也已经达到了320TB,预计2011年底必然会达到1PB。

videostorm 2013-10-26   485   0
P50

  Hadoop 实战手册 文档

Hive仓库集群部署入门文档 27 1. 名词解释 27 2. Hive的作用和原理说明 27 #数据仓库结构图 27 #Hive仓库流程图 27 #hive内部结构图 27 3. Hive 部署和安装

ka520 2015-11-14   434   0
P11

  PowerDesigner 使用心得 文档

er可以制作数据流程图、概念数据模型、物理数据模型,可以生成多种客户端开发工具的应用程序,还可为数据仓库制作结构模型,也能对团队设备模型进行控制。 公司主要使用PowerDesigner创建以下两类模型文件:

x22p 2014-12-25   2805   0

AWS:过去那一年,我们都在中国做什么? 资讯

,让更多用户可以使用 AWS 的服务,而且还可以实现 AWS 很多备受好评的功能的全球同步,比如数据仓库解决方案 Redshift。 “估计明年年底或者在 2016 年年初的时候,位于宁夏的第二个

jopen 2014-11-17   6677   0
AWS  

推荐五款最常见的云数据库 资讯

数据是存储在固态硬盘上的并复制到三个可用站点,这使其成为了一个快速而且高可用的系统。Redshift是一个数据仓库服务,它使用列存储技术结合了分 布式,并行查询所支持的数据集,范围从GB级别到PB级别甚至更多。

fdwm 2015-04-18   17209   0

大象的崛起!Hadoop七年发展风雨录 资讯

HD,以助其满足客户日益增长的数据分析需求并加快利用开源数据分析软件。Greenplum是EMC在2010年7月收购的一家开源数据仓库公司。 2011年5月,在收购了Engenio之后, NetApp推出与Hadoop应用结合的产品E5400存储系统。

fmms 2011-09-11   30305   4

为什么我还在编程 资讯

的一个小组集成了我发布在 Apache Hive 上的一个压缩位图索引库:基于 Hadoop 的数据仓库框架。如果为 Facebook 是否有人读过我为这个软件撰写的 论文 打赌,我肯定会赚到一大笔钱。

jopen 2012-07-09   5071   0

2015年大数据顶尖职位必备的9项技能 资讯

loudera所发布的Impala等开源项目, SQL获得了新生, 成为下一代Hadoop规模的数据仓库的通用语言。 7. Data Visualization(数据可视化) 大数据可能不是那么容易理解

jopen 2015-09-02   28240   0

Android开发MVP模式实践 经验

这里对Data中的数据进行逻辑处理,为Present提供业务逻辑和数据支持。 3)Data 数据仓库。例如,当通过id获取用户数据时,首先会检测用户信息是否已经存储在本地,否则的话就会从服务器获取

kusajin 2014-10-16   10258   0
P30

  Hadoop 淘宝方案 文档

MapReduce框架 并行数据分析语言Pig 列存储NoSQL数据库 Hbase 分布式协调器Zookeeper 数据仓库Hive(使用SQL) Hadoop日志分析工具ChukwaHadoop生态系统 11. 11Data

qsf113 2012-05-09   664   0
1 2 3 4 5 6 7 8 9 10