开源项目,开源代码,开源文档,开源新闻,开源社区

据，数据将保留较长时间,满足系统最细粒度的查询需要 c) DM: 数据集市。基于部门或某一特定分析主题需要 d) RPT:直接面向用户的报表 2. 形成了流量、团购、信息三大基础模型及构建于三大基础模型之上的数据集市

cnffe 2015-11-06 25029 0

架构

就是 akullpp 发起维护的 Java 资源列表，内容包括：构建工具、数据库、框架、模板、安全、代码分析、日志、第三方库、书籍、Java 站点等等。伯乐在线已经把 awesome-java 资源列表翻成中文后发布于

jopen 2015-11-03 117384 0

Java Java开发

板、安全、代码分析、日志、第三方库、书籍、Java 站点等等。业务流程管理套件流程驱动的软件系统构建，中间件。 jBPM ：非常灵活的业务流程管理框架，致力于构建开发与业务分析人员之间的桥梁。

awzebr76hj 2016-09-18 10317 0

Java Java开发

view）的管理（创建、丢弃、持久化和自动识别）；基于物化视图的Lattice和Tile机制，以应用于OLAP分析；支持对流数据的查询。下面对其中的一些特性更详细的介绍。基于关系代数的查询引擎我们

jopen 2015-09-17 48869 0

分布式/云计算/大数据 Apache Calcite

P14

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 513 0

Spark 分布式/云计算/大数据

P13

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 1224 0

分布式/云计算/大数据

Spark是一个当下很火的集群计算平台，来自于加州大学伯克利分校的AMPLab，目前从Apache孵化器毕业，成为了Apache基金会下的顶级项目。现在的spark类似于hadoop，逐渐成长为一种生

jopen 2016-01-07 8190 0

Hadoop 分布式文件系统分布式/云计算/大数据

高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。InfoQ一直在紧密关注 Kafka的应用以及发展，“Kafka

jopen 2015-03-10 38718 0

Kafka 消息系统

高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。InfoQ一直在紧密关注 Kafka的应用以及发展，“Kafka

jopen 2015-03-10 56968 0

Kafka 消息系统

RC3、RC4、PreGA、到现在的 1.0 正式版，一步步见证了 TiDB 的成熟和稳定。目前支撑着摩拜内部的实时分析和部分线上业务，同时正在规划迁移更多的线上业务至 TiDB。目前，TiDB 在摩拜部署了数套集群，近百个节点，承载着数十

GarfieldN40 2017-12-26 39865 0

TiDB

来运行分析作业。该技术我们在 Zions 研究的是在 MapR 平台和 MapR-FS 之上运行的 Apache Mesos.我的目标是尝试构建一个无处不在的计算平台。为了分析，我运行Spark和 Myriad

jopen 2015-07-07 7919 0

Mesos

包括Aerospike、Redis以及Memchached在内的多套系统。除此之外，另有大量分析、报告、数据仓库以及数据科学功能集需要接入到不同类型的数据库当中。从宏观规模角度看，这些功能必须具

jopen 2015-02-02 18137 0

网站

P16

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 449 0

Spark 分布式/云计算/大数据

P16

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 1858 0

Spark 分布式/云计算/大数据

lin-algorithm Apache Kylin（麒麟）是由eBay贡献给开源社区的大数据分析引擎，支持在超大数据集上进行秒级别的SQL及OLAP查询，目前是Apache基金会的孵化项目[1

jopen 2015-09-10 25064 0

Apache Kylin

（Azure Data Lake）服务，该服务被用于云分析，包括了一个超大规模信息库；一个在 YARN 上建立的新的的分析服务，该服务允许数据开发者和数据科学家分析全部的数据；还有 HDInsight ，一个全面管理

jopen 2015-10-14 11530 0

U-SQL SQL

次采访整理而成。阿里巴巴的搜索引擎承担着全集团的搜索业务，包括淘宝、天猫、1688 等系统，对比传统的搜索引擎，阿里集团的搜索引擎有一些比较大的突破性、创造性的工作。传统的搜索引擎，只可以做到离线全量、增量构建索引，而阿里的搜索

jopen 2014-11-11 6656 0

搜索引擎

上结合Linkedin用户访问量，申请数做出的挖掘。我这里列出了最近3年，大家可以做个判别和趋势分析，里面还是很大靠谱的，比如不少上榜名单已经成功IPO（GoPro. Hortonworks, Sp

jopen 2015-01-26 192894 0

Hadoop 分布式/云计算/大数据

上结合Linkedin用户访问量，申请数做出的挖掘。我这里列出了最近3年，大家可以做个判别和趋势分析，里面还是很大靠谱的，比如不少上榜名单已经成功IPO（GoPro. Hortonworks, Splunk)，里面有很多

jopen 2015-01-25 84829 0

大数据分布式/云计算/大数据

Hadoop的唯一选择，负责将SQL解析成MR任务运行在大数据上，实现交互式查询、报表等功能。就在那个时候，Spark社区的小伙伴就意识到可以使用Spark作为执行引擎替换Hive中的MR，这样可以使Hive的执行效率得到极大提升。

MarthaRagan 2017-02-16 27679 0

Spark SQL 数据库

大众点评数据平台架构变迁经验

Java资源大全中文版经验

Java资源大全中文版（Awesome最新版）经验

Hadoop中新型大数据查询引擎：Apache Calcite 经验

(9)KeyValue对RDDs(一) 文档

(10)KeyValue对RDDs(二) 文档

Dpark源码剖析经验

Kafka剖析（一）：Kafka背景及架构介绍经验

Kafka剖析(一):高扩展、高吞吐的分布式消息系统初探经验

TiDB 在摩拜单车在线数据业务的应用和实践经验

我在mesos上运行docker的经验资讯

如何应对单日十亿计Web请求经验

(6)RDDs基本操作之Transformations 文档

(7)RDDs基本操作之Actions 文档

Apache Kylin的快速数据立方体算法 - 概述资讯

U-SQL 介绍 - 大数据处理语言经验

天猫11.11：搜索引擎实时秒级更新资讯

大数据相关技术、Hadoop生态、LinkedIn内部实战经验

讲给硅谷创业者的大数据精华集合经验

SparkSQL－从DataFrame说起经验

Flink，Spark Streaming，Storm对比分析的相关搜索

关键词

大众点评数据平台架构变迁 经验

Java资源大全中文版 经验

Java资源大全中文版（Awesome最新版） 经验

Hadoop中新型大数据查询引擎：Apache Calcite 经验

(9)KeyValue对RDDs(一) 文档

(10)KeyValue对RDDs(二) 文档

Dpark源码剖析 经验

Kafka剖析（一）：Kafka背景及架构介绍 经验

Kafka剖析(一):高扩展、高吞吐的分布式消息系统初探 经验

TiDB 在摩拜单车在线数据业务的应用和实践 经验

我在mesos上运行docker的经验 资讯

如何应对单日十亿计Web请求 经验

(6)RDDs基本操作之Transformations 文档

(7)RDDs基本操作之Actions 文档

Apache Kylin的快速数据立方体算法 - 概述 资讯

U-SQL 介绍 - 大数据处理语言 经验

天猫11.11：搜索引擎实时秒级更新 资讯

大数据相关技术、Hadoop生态、LinkedIn内部实战 经验

讲给硅谷创业者的大数据精华集合 经验

SparkSQL－从DataFrame说起 经验

Flink，Spark Streaming，Storm对比分析 的相关搜索

关键词

大众点评数据平台架构变迁经验

Java资源大全中文版经验

Java资源大全中文版（Awesome最新版）经验

Dpark源码剖析经验

Kafka剖析（一）：Kafka背景及架构介绍经验

Kafka剖析(一):高扩展、高吞吐的分布式消息系统初探经验

TiDB 在摩拜单车在线数据业务的应用和实践经验

我在mesos上运行docker的经验资讯

如何应对单日十亿计Web请求经验

Apache Kylin的快速数据立方体算法 - 概述资讯

U-SQL 介绍 - 大数据处理语言经验

天猫11.11：搜索引擎实时秒级更新资讯

大数据相关技术、Hadoop生态、LinkedIn内部实战经验

讲给硅谷创业者的大数据精华集合经验

SparkSQL－从DataFrame说起经验

Flink，Spark Streaming，Storm对比分析的相关搜索