开源项目,开源代码,开源文档,开源新闻,开源社区

2012 年秋天 Facebook 启动 Presto 项目，目的包括交互式查询、加速商业数据仓库以及扩展 Facebook 处理数据的规模。2013 年春季在整个 Facebook 使用。2013

jopen 2015-11-21 19768 0

PrestoDB

在消息消费端，有不同类型的消费者，例如：离线消费者（offline consumer）：消费消息，将它们存储到Hadoop或传统数据仓库用于离线分析接近实时的消费者（near real-time consumer）：消费消息，将它

jopen 2015-12-31 22385 0

Kafka 消息系统

的服务，所以不是每个人都能对代码的每个角落了如指掌。我们中有些人偏重于前端的工作，有些人侧重于数据仓库和报表，还有些人则在后端折腾Ruby代码。我们都会经常重新搭配分组以相互传播知识，不过始终还是

y35w 2015-07-09 36686 0

代码审查代码分析/审查/优化

Hadoop权威指南评价：7.8/10,很厚，Hadoop讲的很深，不太适合入门，适合做数据仓库的人看，数据挖掘的可以先看看hadoop实战推荐指数：三颗星 14. Hadoop实战

cy_ygs 2016-04-12 35448 0

数据挖掘数据分析分布式/云计算/大数据

http://alloyteam.github.io/JXAnimate/ 23. TDW 腾讯分布式数据仓库项目，在Hadoop和hive的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracl

ywe18826 2016-10-19 23452 0

开源

这是一个长期待解决的讨论话题，如果大家能够分享各自的解决方案，那真真是极好的。我的策略是使用回调，这样的话，如果数据仓库发生了变化，回调有两个方法：onResponse()和onError(). onError方法将

jopen 2015-03-23 86287 0

Android Android开发移动开发

了要处理这些在线业务，还有很大一部分用户没有直观感受的后台业务要处理，包括搜索引擎的索引构建，数据仓库的数据分析统计等。这些业务的计算规模非常庞大，目前网站普遍使用Hadoop及其MapReduce

jopen 2015-03-10 24888 0

架构

之上，包括以下内容： Apache HBase 的是针对大表的分布式数据库。 Apache Hive 是一个数据仓库中的基础设施，它允许在 HDFS 中存储的数据中进行临时的类似 SQL 的查询。 Apache Pig

jopen 2014-04-13 13945 0

大数据

，也与Pinot的主程Praveen建立了非常好的关系。作者：吴继业作者简介：在数据仓库，数据分析和数据工程领域有13年工作经验，前LinkedIn商务分析部数据工程总监，现任Gorwoingio联合创始人。曾经就职于宝信

jopen 2015-07-16 16088 0

大数据

Technology，后者是当时世界上顶尖的数据库咨询服务公司之一，他作为解决方案架构师，主要关注数据仓库和BI战略。查看英文原文： Philip Rathle on Neo4j 2.3 Graph

jopen 2015-12-11 13706 0

Neo4j

P18

用程序。传统的商业智能应用：针对特定问题的BI数据库会对产生高度优化的查询方式。对于此类应用，数据仓库可能是更合适的选择。需要SQL的问题 MongoDB简介 7. 谁在使用? MongoDB简介

皇爵灰烬 2012-07-25 3266 0

NoSQL数据库培训 C# C/C++ ErLang

P22

无条件执行;当上一个Job执行结果为true时执行;当上一个Job执行结果为false时执行) Kettle 是BI数据仓库解决方案Pentaho的组件之一。 3. Kettle整体结构图 4. Kettle使用-下载&

305955792 2011-01-05 10162 0

数据挖掘方案培训 Java JavaScript

） Facebook图片存储架构的学习 facebook图片存储架构技术全解析 Facebook数据仓库揭秘：RCFile高效存储结构 Facebook 架构学习 Facebook 架构学习人人网移动开发架构

jopen 2015-07-17 78934 0

架构软件架构

开发企业应用时我们常常遇到要同时访问多种不同数据库的问题，有时是必须把数据归档到某种数据仓库中，有时是要把数据变更推送到第三方数据库中。使用Spring框架时，使用单一数据库是非常容易的，但如果要同时访问多个数据库的话事件就变得复杂多了。

tsaw8002 2016-12-20 15743 0

数据库 Spring Java开发

础设施问题相对简单 - 通常这些拟合过程很容易并行化，预测不难存储在关系数据库（如MySQL）或数据仓库（如Hive）中。我们在实践中观察到的规模问题涉及由各种预测问题引入的复杂性，并且一旦已经

dbpy5819 2017-02-28 20414 0

Python Python开发

数据采集和分析流程，将Hadoop中的原始数据自动转化成可以互动的商业智能服务，无需ETL或者数据仓库。(参考阅读：Hadoop只是穷人的ETL) 二、 Alpine Data Labs

jopen 2014-04-23 28910 0

Hadoop

对用户授权的好处也可以应用到产品创新上。在2015年10月，EMC的Greenplum大规模并行处理（MPP）数据仓库宣布开源，这降低了人们进入到大规模实时数据分析领域的难度，促使更多的公司能够迎接大数据的挑战。开

jopen 2016-01-15 5945 0

EMC

据库上，一般来说够用，如果还不行可以用硬件来实现数据库的负载均衡。当然，对于BI，我们可能还会有数据仓库。架构上考虑到了这些之后，流量大了，就可以在这个的基础上再去调整或者做WEB服务器或者应用服务

chenhb 2011-08-08 6787 0

架构前端技术

P38

统计类查询10倍 Load数据快（每秒>10万）压缩率5倍（和裸数据比）免优化将来：在数据仓库中环境中，很有前景的产品构架先进有mariadb组织的支持 38. QA中国MySQL用户组

lofe 2015-09-03 468 0

数据库服务器方案 SQL

向操作应用程序提供输入，并从操作应用程序接收实时更新的数据；弥合主要数据管理和运行应用程序，分析数据仓库和数据湖之间的差距。据预测：现有的大数据项目意识到需要一个可靠的数据基础，而新的项目被整合

WilGrisham 2016-12-20 14393 0

大数据数据科学物联网分布式/云计算/大数据

数据仓库的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

SQL Spring JavaScript Python Java Android Neo4j C/C++ 数据挖掘消息系统大数据 Kafka 前端技术物联网 Java开发数据分析软件架构 PrestoDB Android开发数据科学 EMC Python开发代码分析/审查/优化数据库服务器分布式/云计算/大数据 NoSQL数据库代码审查 ErLang 数据库移动开发

Presto DB 简介经验

[Apache Kafka]Kafka简介经验

代码审查过程经验

数据分析/数据挖掘/机器学习---- 必读书目经验

实用高效，25款腾讯热门开源项目推荐经验

一种更清晰的Android架构经验

第2章大型网站架构模式经验

大数据处理的开发经验资讯

Pinot-LinkedIn如何将大数据做到实时与民主化资讯

Philip Rathle谈Neo4j 2.3图数据库新特性和openCypher计划资讯

MongoDB 入门培训文档

Kettle使用培训文档文档

架构学习资料汇总经验

Java Spring中同时访问多种不同数据库经验

Prophet（先知）：Facebook大规模预报框架经验

2014年值得关注的十个Hadoop大数据创业公司资讯

如何构建创新文化——技术视角资讯

大型门户网站站架构心得文档

Infinidb 在大数据的实战应用文档

2017年大数据发展八大预测经验

数据仓库的相关搜索

关键词

Presto DB 简介 经验

[Apache Kafka]Kafka简介 经验

代码审查过程 经验

数据分析/数据挖掘/机器学习---- 必读书目 经验

实用高效，25款腾讯热门开源项目推荐 经验

一种更清晰的Android架构 经验

第2章 大型网站架构模式 经验

大数据处理的开发经验 资讯

Pinot-LinkedIn如何将大数据做到实时与民主化 资讯

Philip Rathle谈Neo4j 2.3图数据库新特性和openCypher计划 资讯

MongoDB 入门培训 文档

Kettle使用培训文档 文档

架构学习资料汇总 经验

Java Spring中同时访问多种不同数据库 经验

Prophet（先知）：Facebook大规模预报框架 经验

2014年值得关注的十个Hadoop大数据创业公司 资讯

如何构建创新文化——技术视角 资讯

大型门户网站站架构心得 文档

Infinidb 在大数据的实战应用 文档

2017年大数据发展八大预测 经验

数据仓库 的相关搜索

关键词

Presto DB 简介经验

[Apache Kafka]Kafka简介经验

代码审查过程经验

数据分析/数据挖掘/机器学习---- 必读书目经验

实用高效，25款腾讯热门开源项目推荐经验

一种更清晰的Android架构经验

第2章大型网站架构模式经验

大数据处理的开发经验资讯

Pinot-LinkedIn如何将大数据做到实时与民主化资讯

Philip Rathle谈Neo4j 2.3图数据库新特性和openCypher计划资讯

MongoDB 入门培训文档

Kettle使用培训文档文档

架构学习资料汇总经验

Java Spring中同时访问多种不同数据库经验

Prophet（先知）：Facebook大规模预报框架经验

2014年值得关注的十个Hadoop大数据创业公司资讯

如何构建创新文化——技术视角资讯

大型门户网站站架构心得文档

Infinidb 在大数据的实战应用文档

2017年大数据发展八大预测经验

数据仓库的相关搜索