学习笔记:The Log(我所读过的最好的一篇分布式技术文章) 经验

在这种情况下,每个订阅者都以自己的步调消费数据。 一个批处理系统,比如Hadoop,或者一个数据仓库,是以小时或天为单位消费数据,而一个实时系统,通常在秒级消费数据。 而数据源或者log,对消

jopen 2015-07-20   53392   0

每个软件工程师都应该知道的有关实时数据的统一概念 经验

n-Transformation-Loading的缩写,即数据提取、转换和加载)——相对于关系型数据仓库。但我描述的东西很大程度上可以理解为,将ETL推广至实时系统和处理流程。 你一定不会听到

jopen 2014-02-10   98975   0

详解Hadoop核心架构 经验

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。

jopen 2015-07-30   19557   0

Hive深入浅出 经验

capabilities of the language. Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在

jopen 2014-08-31   63675   0
P61

  SAP BW BI 培训教程经典案例 文档

SAP BW – BW核心功能数据仓库 (SAP BW 管理员工作台) 抽取、传输与上载 数据仓库管理 业务模型 BI 平台 在线分析处理 (OLAP) 数据挖掘 预警 元数据仓库 BI 套装工具 (SAP

redeyes001 2014-09-26   5912   0
SAP   ERP/CRM   培训   C#   Intel  
P44

  the log:每个程序员都应该知道有关实时数据的统一抽象 文档

ng的缩写,即数据提取、转换和加载) 通常只是覆盖了数据集成的一个有限子集 —— 主要在关系 型数据仓库的场景。但我描述的东西很大程度上可以理解为,将ETL推广至覆盖实时系统和处理流程。 你一定不会听

june.zk 2016-09-12   479   0
P31

  大数据模型构建平台介绍v1.0 文档

项目实施往往加班加点,人力资源复用率较低,工作效率不高 通信行业BI系统进入瓶颈期,指标杂乱,管理无序,效率低下,亟需对数据仓库进行重构; 目前多省已表达出重构需求,工程量随时可能放大 亚信战略转型,放眼金融业、电商、政企等

cqupt1987 2015-10-10   2002   0
方案   SQL  
P64

  大数据智能分析解决方案介绍-ibm 文档

在大数据的新世界中,我们必须更换所有陈旧系统 大数据就是 Hadoop 较为陈旧的事务数据已经不再重要 数据仓库已是昨日黄花 大数据适合熟知互联网的企业。传统业务与大数据毫无关系 我们不具备相应的需求、预算或

guet_lee 2017-01-15   10670   0

大数据与Hadoop之间是什么关系? 经验

Hbase 、Zookeeper(一个针对大型分布式系统的可靠协调系统),hive(基于Hadoop的一个数据仓库工具)等。 1.云计算属于大数据中的大数据技术范畴。 2.云计算包含大数据。 3.云和大数据是两个领域。

pm45e 2015-08-03   32007   0

国产首创分布式内存数据库一体机发布 资讯

半结构化和非结构化的数据,为企业提供快捷的业务决策支持。它的出现突破了传统基于磁盘的数据仓库技术,解决了传统数据仓库难以分析结构化以外数据的难题,并通过高性能,线性扩展及整合方案为企业带来显著效益。它

jopen 2016-01-19   12763   0

BigInsights:解读IBM基于Hadoop的数据分析平台 资讯

能力。Streams 采用内存计算方式分析实时数据。InfoSphere 大数据分析平台还集成了数据仓库、数据库、数据集成、业务流程管理等组件。 BigInsight 整体框架图 BigInsights

openkk 2012-02-25   30861   0
Hadoop  
P17

  ETL及KETTLE简介 文档

)、装载(Load)的过程。它是构建数据仓库的重要环节。数据仓库是面向主题的、集成的、稳定的且随时间不断变化的数据集合,用以支持经营管理中的决策制定过程。数据仓库系统中有可能存在着大量的噪声数据,引起

chenshengli 2011-08-10   8714   0
P19

  数据管理知识体系 文档

4:快速的可扩展能力 5:节能及节省空间 6:高IT资源利用率 7:高可靠性和低冗余 8:面向服务的计算平台 5. 数据仓库设计--The Basic Structure of the CIF5External worl

小小小鱼啊 2017-08-30   1090   0
数据结构   SQL   XML   Basic  

构建一个可测试的 Go Web 应用 经验

个API客户端构建和发起请求了。 2. 统一HTTP API客户端和数据仓库的接口 接下来,我们统一HTTP API和数据仓库的接口。以前我们的API http.Handlers直接发起SQL查询。现在我们的API

jopen 2014-10-14   23566   0
P14

  ofbiz业务培训(00)-总体介绍 文档

人力资源、薪金名册、培训、时间和出勤、津贴 客户关系管理  销售和市场、佣金、服务、客户联系和调用中心支持 数据仓库  和客户、供应商、员工之间的各种自服务接口 5. 系统集成性一般ERP软件强调如下之系统集成性:

renhy0530 2016-11-09   2238   0
方案   报告   手册   培训   Apache  

京东大数据基础构架与创新应用 经验

京东大数据平台从无到有,从集中式到分布式,从Oracle数据仓库到JDW2.0,在演变过程中一直在思考的两个问题: 1、如何建设电商特有的复杂业务的数据仓库? 2、如何在保障安全的情况下降低使用数据的

jopen 2014-12-12   23539   0
P9

  大数据之惑 文档

大数据的最大困惑 --- 海量的数据收集上来不知道怎么用! 这里反过头来不妨看看为什么以前传统的数据仓库领域为什么没有这样的困惑。如下这张图很好的说明了传统时代和现在时代的区别: (图片源自: Sogeti)

songyl525 2013-12-11   1649   0

【译】使用Apache Kafka构建流式数据平台(1) 经验

么要做这个工作,有下面两个原因: 数据整合:数据如何在各个系统之间流转和传输; 流式处理:通常在数据仓库或者Hadoop集群中需要做丰富的数据分析,同时实现低延时。 接下来介绍下上述两个理论的提出

jopen 2016-01-08   33342   0

ODPS技术架构及应用实践 经验

并发、高吞吐量的数据上传和下载服务。 SQL:基于SQL92并进行了本地化扩展,可用于构建大规模数据仓库和企业BI系统,是应用最为广泛的一类服务。 DAG编程模型:类似Hadoop MapReduce

jopen 2014-10-30   45061   0

浅谈开源大数据平台的演变 经验

超大文件。 虽 然Hadoop的MapReduce框架足够易用,但是对于传统使用SQL操作的数据仓库类需求时,直接调用Map和Reduce接口来达到类似效果,还 是相对繁琐,而且对不熟悉MapRe

jopen 2015-11-21   25453   0
1 2 3 4 5 6 7 8 9 10