开源项目,开源代码,开源文档,开源新闻,开源社区

着YRAN既不是为长时间运行的服务而设计，也不是为满足短期交互/快速响应式请求（像简短而快速的Spark任务），尽管它可能调度其他种类的工作任务，但这并不是一个理想的模型。MapReduce的资源需求

jopen 2015-12-29 36140 0

YARN

本都是必须考虑的。就拿Spark Hive和Hive来说，同样是在Yarn上来跑P，而且替换任务的执行引擎也很方便。修改任务执行引擎的确，Spark的大多数任务都会比MapRed

BetterCoo1 2017-01-10 32210 0

数据挖掘大数据分布式/云计算/大数据

。基于Mesos之上可以运行不同的分布式计算平台，如Spark、Storm、Hadoop、Marathon和Chronos等。Spark、Storm和Hadoop这样的计算平台有任务调度功能，可以直接使用Mesos

BetBarnard 2016-08-18 17982 0

Mesos Docker 分布式计算

是一种资源抽象工具，有了它，企业就可以鼗整个数据中心当成一个资源池，它在又在运行 Hadoop、Spark 及类似应用程序的公司当中很流行。使用它的企业组织包括：Airbnb、欧洲原子核研究组织（CER

jopen 2016-02-26 38527 0

新增、删除、查询索引 3.4.3. Storm，流式计算，了解Spark，S4 在linux上部署storm，用zookeeper做协调，运行storm hello world，local和remote模式运行调试storm

jopen 2015-12-08 213763 15

Java

ve将由传统的一次写入、频繁读取的系统发展为一个支持变化数据分析的系统。实现亚秒级查询——用户可以将Hive用于像交互式仪表板和探究性分析这样对响应时间有更高要求的应用场景。全面支持 SQL：2011

jopen 2014-09-14 10444 0

Hive

P12

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 482 0

Spark 分布式/云计算/大数据 Java Scala

P12

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 1687 0

Spark 分布式/云计算/大数据

图）整合Kafka之前，Hortonworks还在Hadoop中集成了Apache Storm流处理系统，可以看出，Hortonworks正在大力发展快数据技术，来迎合那些需要自己大数据基础架构的，工程导向的企业；例如那些已经拥

jopen 2014-08-30 12640 0

Kafka

MapReduce 最佳实践 Node.js Streaming MapReduce 在 Amazon Elastic MapReduce 上运行 Spark 和 Shark Apache Accumulo

jopen 2014-01-24 9537 0

亚马逊

P14

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 3530 0

Spark 分布式/云计算/大数据 Java Python Scala

Learning Summer School》介绍：每天请一个大牛来讲座，主要涉及机器学习，大数据分析，并行计算以及人脑研究。 https://www.youtube.com/user/smolix （国内或许不能访问）

b36g 2015-04-04 474372 0

机器学习

的区别是什么 RDD、DataFrame和DataSet是容易产生混淆的概念，必须对其相互之间对比，才可以知道其中异同：DataFrame多了数据的结构信息，即schema。RDD是分布式的 Ja

si19891002 2016-03-21 17146 0

Spark SQL 分布式系统数据挖掘

：我们选择了Spark作为我们的大数据分析平台。基于目前的应用场景，主要使用了Spark SQL，目前使用的版本为Spark 1.5.0。我们有计划去同步升级Spark最新版本。在研发期间，我们从Spark

ohew2481 2017-03-13 28958 0

Scala Scala开发

的配置管理，减少重复操作。 Yarn：资源管理系统，最终的目标是可以将不同的集群容器（storm，spark等）放在同一个yarn系统中，通过yarn的调度来为不同集群分配不同资源。有人会有疑

jopen 2016-01-17 22611 0

Docker Java开发

Weka). MLlib in Apache Spark 1 - Distributed machine learning library in Spark Neuroph - Neuroph is lightweight

jopen 2015-01-08 127601 0

机器学习

目，所以在大数据领域具有先天优势。底层天然就是分布式存储系统HDFS，稳定高效。其上支撑了Spark、MR等大数据领域的扛顶之座，久经考验。社区强大，最近发布版本也明显加快，对于长任务的支持也越来越优秀。

ioriren 2016-02-16 9506 0

YARN Docker

点，如果能够对各类型的并行计算框架都进行深入研究及适当的缺点修复，就可以为不同硬件环境下的海量数据分析需求提供不同的软件层面的解决方案。并行计算框架并行计算或称平行计算是相对于串行计算来说的。

jopen 2015-07-15 71471 0

MapReduce 分布式/云计算/大数据

随着计算机的日益普及，各种应用每天产生的数据量呈指数级增长。如何存储这些数据，有效处理分析这些数据,并从中提取有价值的信息,是当下迫切需要解决的问题。在过去的十年里，NoSQL在软件工程师阵营里越来越

KayZiegler 2017-10-17 83039 0

SQL NOSQL

Hadoop入门 2011年初我加入了一个互联网流量分析运营项目，开始真正实战Hadoop,编写mapreduce程序。项目主要是对用户浏览的url进行分析，挖掘用户的上网行为偏好，进行精准营销。整个项目

jopen 2015-03-11 29845 0

Hadoop 分布式/云计算/大数据

Mesos 和YARN：两个集群的故事资讯

大数据挖掘更多时间都在于清洗数据经验

Mesos和Docker分布式计算平台经验

科技公司钟爱的50款开源工具资讯

Java工程师成神之路~ 资讯

Hive未来两年的路线图资讯

(8)RDDs的特性文档

(11)数据分区文档

Hortonworks 集成 Kafka，领跑快数据资讯

亚马逊Web服务发布2013年推荐技术内容列表资讯

(5)RDDs介绍文档

机器学习(Machine Learning)&深度学习(Deep Learning)资料经验

RDD、DataFrame和DataSet的区别是什么经验

基于Scala的产品开发实践经验

Docker应用场景经验

机器学习平台、框架、库和软件集合经验

为什么我要用Yarn来做Docker容器调度引擎经验

五种基于 MapReduce 的并行计算框架介绍及性能测试经验

为什么说SQL正在击败NoSQL，这对数据的未来意味着什么？经验

述说我的Hadoop成长路线经验

Flink，Spark Streaming，Storm对比分析的相关搜索

关键词

Mesos 和YARN：两个集群的故事 资讯

大数据挖掘更多时间都在于清洗数据 经验

Mesos和Docker分布式计算平台 经验

科技公司钟爱的50款开源工具 资讯

Java工程师成神之路~ 资讯

Hive未来两年的路线图 资讯

(8)RDDs的特性 文档

(11)数据分区 文档

Hortonworks 集成 Kafka，领跑快数据 资讯

亚马逊Web服务发布2013年推荐技术内容列表 资讯

(5)RDDs介绍 文档

机器学习(Machine Learning)&深度学习(Deep Learning)资料 经验

RDD、DataFrame和DataSet的区别是什么 经验

基于Scala的产品开发实践 经验

Docker应用场景 经验

机器学习平台、框架、库和软件集合 经验

为什么我要用Yarn来做Docker容器调度引擎 经验

五种基于 MapReduce 的并行计算框架介绍及性能测试 经验

为什么说SQL正在击败NoSQL，这对数据的未来意味着什么？ 经验

述说我的Hadoop成长路线 经验

Flink，Spark Streaming，Storm对比分析 的相关搜索

关键词

Mesos 和YARN：两个集群的故事资讯

大数据挖掘更多时间都在于清洗数据经验

Mesos和Docker分布式计算平台经验

科技公司钟爱的50款开源工具资讯

Hive未来两年的路线图资讯

(8)RDDs的特性文档

(11)数据分区文档

Hortonworks 集成 Kafka，领跑快数据资讯

亚马逊Web服务发布2013年推荐技术内容列表资讯

(5)RDDs介绍文档

机器学习(Machine Learning)&深度学习(Deep Learning)资料经验

RDD、DataFrame和DataSet的区别是什么经验

基于Scala的产品开发实践经验

Docker应用场景经验

机器学习平台、框架、库和软件集合经验

为什么我要用Yarn来做Docker容器调度引擎经验

五种基于 MapReduce 的并行计算框架介绍及性能测试经验

为什么说SQL正在击败NoSQL，这对数据的未来意味着什么？经验

述说我的Hadoop成长路线经验

Flink，Spark Streaming，Storm对比分析的相关搜索