大众点评数据平台架构变迁 经验

据,数据将保留较长时间,满足系统最细粒度的查询需要 c) DM: 数据集市。基于部门或某一特定分析主题需要 d) RPT:直接面向用户的报表 2. 形成了流量、团购、信息三大基础模型及构建于三大基础模型之上的数据集市

cnffe 2015-11-06   25029   0
架构  

Java资源大全中文版 经验

就是 akullpp 发起维护的 Java 资源列表,内容包括:构建工具、数据库、框架、模板、安全、代码分析、日志、第三方库、书籍、Java 站点等等。伯乐在线已经把 awesome-java 资源列表翻成中文后发布于

jopen 2015-11-03   117384   0

Java资源大全中文版(Awesome最新版) 经验

板、安全、代码分析、日志、第三方库、书籍、Java 站点等等。 业务流程管理套件 流程驱动的软件系统构建,中间件。 jBPM :非常灵活的业务流程管理框架,致力于构建开发与业务分析人员之间的桥梁。

awzebr76hj 2016-09-18   10317   0

Hadoop中新型大数据查询引擎:Apache Calcite 经验

view)的管理(创建、丢弃、持久化和自动识别); 基于物化视图的Lattice和Tile机制,以应用于OLAP分析; 支持对流数据的查询。 下面对其中的一些特性更详细的介绍。 基于关系代数的查询引擎 我们

jopen 2015-09-17   48869   0
P14

  (9)KeyValue对RDDs(一) 文档

我们提供专业的大数据学习视频,包括Hadoop,SparkStorm,Mahout,机器学习等。 我们定价合理,让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。 本系列课

ngn6 2015-08-12   513   0
P13

  (10)KeyValue对RDDs(二) 文档

我们提供专业的大数据学习视频,包括Hadoop,SparkStorm,Mahout,机器学习等。 我们定价合理,让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。 本系列课

ngn6 2015-08-12   1224   0

Dpark源码剖析 经验

Spark是一个当下很火的集群计算平台,来自于加州大学伯克利分校的AMPLab,目前从Apache孵化器毕业,成为了Apache基金会下的顶级项目。现在的spark类似于hadoop,逐渐成长为一种生

Kafka剖析(一):Kafka背景及架构介绍 经验

高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache StormSpark都支持与Kafka集成。InfoQ一直在紧密关注 Kafka的应用以及发展 ,“Kafka

jopen 2015-03-10   38718   0

Kafka剖析(一):高扩展、高吞吐的分布式消息系统初探 经验

高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache StormSpark都支持与Kafka集成。InfoQ一直在紧密关注 Kafka的应用以及发展 ,“Kafka

jopen 2015-03-10   56968   0

TiDB 在摩拜单车在线数据业务的应用和实践 经验

RC3、RC4、PreGA、到现在的 1.0 正式版,一步步见证了 TiDB 的成熟和稳定。目前支撑着摩拜内部的实时分析和部分线上业务,同时正在规划迁移更多的线上业务至 TiDB。 目前,TiDB 在摩拜部署了数套集群,近百个节点,承载着数十

GarfieldN40 2017-12-26   39865   0
TiDB  

我在mesos上运行docker的经验 资讯

来运行分析作业。该技术我们在 Zions 研究的是在 MapR 平台和 MapR-FS 之上运行的 Apache Mesos.我的目标是尝试构建一个无处不在的计算平台。为了分析,我运行Spark和 Myriad

jopen 2015-07-07   7919   0
Mesos  

如何应对单日十亿计Web请求 经验

包括Aerospike、Redis以及Memchached在内的多套系统。 除此之外,另有大量分析、报告、数据仓库以及数据科学功能集需要接入到不同类型的数据库当中。从宏观规模角度看,这些功能必须具

jopen 2015-02-02   18137   0
网站  
P16

  (6)RDDs基本操作之Transformations 文档

我们提供专业的大数据学习视频,包括Hadoop,SparkStorm,Mahout,机器学习等。 我们定价合理,让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。 本系列课

ngn6 2015-08-12   449   0
P16

  (7)RDDs基本操作之Actions 文档

我们提供专业的大数据学习视频,包括Hadoop,SparkStorm,Mahout,机器学习等。 我们定价合理,让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。 本系列课

ngn6 2015-08-12   1858   0

Apache Kylin的快速数据立方体算法 - 概述 资讯

lin-algorithm Apache Kylin(麒麟)是由eBay贡献给开源社区的大数据分析引擎,支持在超大数据集上进行秒级别的SQL及OLAP查询,目前是Apache基金会的孵化 项目[1

jopen 2015-09-10   25064   0

U-SQL 介绍 - 大数据处理语言 经验

(Azure Data Lake)服务,该服务被用于云分析,包括了一个超大规模信息库;一个在 YARN 上建立的新的的分析服务,该服务允许数据开发者和数据科学家分析全部的数据;还有 HDInsight ,一个全面管理

jopen 2015-10-14   11530   0
U-SQL   SQL  

天猫11.11:搜索引擎实时秒级更新 资讯

次采访整理而成。 阿里巴巴的搜索引擎承担着全集团的搜索业务,包括淘宝、天猫、1688 等系统,对比传统的搜索引擎,阿里集团的搜索引擎有一些比较大的突破性、创造性的工作。传统的搜索引擎,只可以做到离线全量、增量构建索引,而阿里的搜索

jopen 2014-11-11   6656   0

大数据相关技术、Hadoop生态、LinkedIn内部实战 经验

上结合Linkedin用户访问量,申请数做出的挖掘。我这里列出了最近3年,大家可以 做个判别和趋势分析,里面还是很大靠谱的,比如不少上榜名单已经成功IPO(GoPro. Hortonworks, Sp

jopen 2015-01-26   192894   0

讲给硅谷创业者的大数据精华集合 经验

上结合Linkedin用户访问量,申请数做出的挖掘。我这里列出了最近3年,大 家可以做个判别和趋势分析,里面还是很大靠谱的,比如不少上榜名单已经成功IPO(GoPro. Hortonworks, Splunk),里面有很多

jopen 2015-01-25   84829   0

SparkSQL-从DataFrame说起 经验

Hadoop的唯一选择,负责将SQL解析成MR任务运行在大数据上,实现交互式查询、报表等功能。就在那个时候,Spark社区的小伙伴就意识到可以使用Spark作为执行引擎替换Hive中的MR,这样可以使Hive的执行效率得到极大提升。

MarthaRagan 2017-02-16   27679   0
1 2 3 4 5 6 7 8 9 10