Presto DB 简介 经验

2012 年秋天 Facebook 启动 Presto 项目,目的包括交互式查询、加速商业数据仓库以及扩展 Facebook 处理数据的规模。2013 年春季在整个 Facebook 使用。2013

jopen 2015-11-21   19768   0

[Apache Kafka]Kafka简介 经验

在消息消费端,有不同类型的消费者,例如: 离线消费者(offline consumer):消费消息,将它们存储到Hadoop或传统数据仓库用于离线分析 接近实时的消费者(near real-time consumer):消费消息,将它

jopen 2015-12-31   22385   0

代码审查过程 经验

的服务,所以不 是每个人都能对代码的每个角落了如指掌。我们中有些人偏重于前端的工作,有些人侧重于数据仓库和报表,还有些人则在后端折腾Ruby代码。我们都会经常重 新搭配分组以相互传播知识,不过始终还是

y35w 2015-07-09   36686   0

数据分析/数据挖掘/机器学习---- 必读书目 经验

Hadoop权威指南 评价:7.8/10,很厚,Hadoop讲的很深,不太适合入门,适合做数据仓库的人看,数据挖掘的可以先看看hadoop实战 推荐指数:三颗星 14. Hadoop实战

实用高效,25款腾讯热门开源项目推荐 经验

http://alloyteam.github.io/JXAnimate/ 23. TDW 腾讯分布式数据仓库项目,在Hadoop和hive的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracl

ywe18826 2016-10-19   23452   0
开源  

一种更清晰的Android架构 经验

这是一个长期待解决的讨论话题,如果大家能够分享各自的解决方案,那真真是极好的。 我的策略是使用回调,这样的话,如果数据仓库发生了变化,回调有两个方法:onResponse()和onError(). onError方法将

jopen 2015-03-23   86287   0

第2章 大型网站架构模式 经验

了要处理这些在线业务,还有很大一部分用户没有直观感受的后台业务要处理,包括搜索 引擎的索引构建,数据仓库的数据分析统计等。这些业务的计算规模非常庞大,目前网站普遍使用Hadoop及其MapReduce

jopen 2015-03-10   24888   0
架构  

大数据处理的开发经验 资讯

之上,包括以下内容: Apache HBase 的是针对大表的分布式数据库。 Apache Hive 是一个数据仓库中的基础设施,它允许在 HDFS 中存储的数据中进行临时的类似 SQL 的查询。 Apache Pig

jopen 2014-04-13   13945   0

Pinot-LinkedIn如何将大数据做到实时与民主化 资讯

,也与Pinot的主程Praveen建立了非常好的关系。 作者: 吴继业 作者简介: 在数据仓库,数据分析和数据工程领域有13年工作经验,前LinkedIn商务分析部数据工程总监,现任Gorwoingio联合创始人。曾经就职于宝信

jopen 2015-07-16   16088   0

Philip Rathle谈Neo4j 2.3图数据库新特性和openCypher计划 资讯

Technology,后者是当时世界上顶尖的数据库咨询服务公司之一,他作为解决方案架构师,主要关注数据仓库和BI战略。 查看英文原文: Philip Rathle on Neo4j 2.3 Graph

jopen 2015-12-11   13706   0
Neo4j  
P18

  MongoDB 入门培训 文档

用程序。 传统的商业智能应用:针对特定问题的BI数据库会对产生高度优化的查询方式。对于此类应用,数据仓库可能是更合适的选择。 需要SQL的问题 MongoDB简介 7. 谁在使用? MongoDB简介

皇爵灰烬 2012-07-25   3266   0
P22

  Kettle使用培训文档 文档

无条件执行;当上一个Job执行结果为true时执行;当上一个Job执行结果为false时执行) Kettle 是BI数据仓库解决方案Pentaho的组件之一。 3. Kettle整体结构图 4. Kettle使用-下载&

305955792 2011-01-05   10162   0

架构学习资料汇总 经验

) Facebook图片存储架构的学习 facebook图片存储架构技术全解析 Facebook数据仓库揭秘:RCFile高效存储结构 Facebook 架构学习 Facebook 架构学习 人人网移动开发架构

jopen 2015-07-17   78934   0

Java Spring中同时访问多种不同数据库 经验

开发企业应用时我们常常遇到要同时访问多种不同数据库的问题,有时是必须把数据归档到某种数据仓库中,有时是要把数据变更推送到第三方数据库中。使用Spring框架时,使用单一数据库是非常容易的,但如果要同时访问多个数据库的话事件就变得复杂多了。

tsaw8002 2016-12-20   15743   0

Prophet(先知):Facebook大规模预报框架 经验

础设施问题相对简单 - 通常这些拟合过程很容易并行化,预测不难存储在关系数据库(如MySQL)或数据仓库(如Hive)中。 我们在实践中观察到的规模问题涉及由各种预测问题引入的复杂性,并且一旦已经

dbpy5819 2017-02-28   20414   0

2014年值得关注的十个Hadoop大数据创业公司 资讯

数据采集和分析 流程,将Hadoop中的原始数据自动转化成可以互动的商业智能服务,无需ETL或者数据仓库。(参考阅读:Hadoop只是穷人的ETL) 二、 Alpine Data Labs

jopen 2014-04-23   28910   0
Hadoop  

如何构建创新文化——技术视角 资讯

对用户授权的好处也可以应用到产品创新上。在2015年10月,EMC的Greenplum大规模并行处理(MPP)数据仓库宣布开源,这降低了人们进入到大规模实时数据分析领域的难度,促使更多的公司能够迎接大数据的挑战。开

jopen 2016-01-15   5945   0
EMC  
P3

  大型门户网站站架构心得 文档

据库上,一般来说够用,如果还不行可以用硬件来实现数据库的负载均衡。当然,对于BI,我们可能还会有数据仓库。 架构上考虑到了这些之后,流量大了,就可以在这个的基础上再去调整或者做WEB服务器或者应用服务

chenhb 2011-08-08   6787   0
P38

  Infinidb 在大数据的实战应用 文档

统计类查询10倍 Load数据快(每秒>10万) 压缩率5倍(和裸数据比) 免优化 将来:在数据仓库中环境中,很有前景的产品 构架先进 有mariadb组织的支持 38. QA中国MySQL用户组

lofe 2015-09-03   468   0

2017年大数据发展八大预测 经验

向操作应用程序提供输入,并从操作应用程序接收实时更新的数据;弥合主要数据管理和运行应用程序,分析数据仓库和数据湖之间的差距。 据预测:现有的大数据项目意识到需要一个可靠的数据基础,而新的项目被整合

1 2 3 4 5 6 7 8 9 10