开源项目,开源代码,开源文档,开源新闻,开源社区

直接由Kafka一端的Logstash存储到Elasticsearch（跑在Docker中）中。一份COPY 经过Spark（跑在Docker中）Stream做实时处理（包括一些特定日志的提取），然后将处理的结果存储在 Elasticsearch

jopen 2015-10-05 35557 0

Docker

P16

通过将集群管理一般化，研究转到分布式计算的一般化上，来扩展了MapReduce的初衷。 7. Spark是基于内存计算的，是云计算领域继Hadoop之后下一代最热门并行计算框架开源项目，它的核心是弹性分布式数据集（RDD）。

勇敢勒小虎 2017-01-10 2568 0

Hadoop 分布式/云计算/大数据方案 Apache SQL

特点： 1、基于Flex SDK 4.6.x 2、包含spark和mx组件 3、所有组件均由代码实现（非Flash制作） 4、源代码开放测试： http://www.k-zone

openkk 2012-08-20 72904 0

Flex Flex开发

雅虎网站博客写手丹尼尔-豪利（Daniel Howley）专门体验了亚马逊推出的社交网络 Amazon Spark，并撰文描述了使用该社交网络的体验。下面是他的这篇文章全文：据外媒报道，无论在哪里你都可以

jopen 2017-07-19 7283 0

亚马逊

P12

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 548 0

Spark 分布式/云计算/大数据

该说，无论是Spark，Summingbird，还是Pig，都在尝试做同一件事情：借助自己的DSL或原语在流式和批量两套引擎上表达(近)实时和离线数据处理能力。 Spark本身依赖RDD，实现了Spark

jopen 2015-01-16 18290 0

布式计算分布式/云计算/大数据

：我们选择了Spark作为我们的大数据分析平台。基于目前的应用场景，主要使用了Spark SQL，目前使用的版本为Spark 1.5.0。我们有计划去同步升级Spark最新版本。在研发期间，我们从Spark

ohew2481 2017-03-13 28958 0

Scala Scala开发

，神马硬件都是浮云。买不到？太贵？不用担心，我们来自己动手做一个。来自于开源硬件领域的 Spark 已经利用自家的产品把这事搞定了，而且只是 3 个工程师花了一天的时间，成本也不过几十美金。让我们一起来看看他们是怎么做到的。

jopen 2014-01-20 6125 0

开源

Observable API 和 Spark Streaming（支持现有的 Spark job）进行流处理。通过提供一系列的选项，你可以选择最适合任务的函数式编程模块。 Spark Streaming 集成特性如下：

b4c2 2015-01-29 8339 0

Spring XD

P6

2014-07-16 13:51 大数据我们都知道hadoop，可是还会各种各样的技术进入我们的视野：Spark，Storm，impala，让我们都反映不过来。为了能够更好的架构大数据项目，这里整理一下，供

tony2007 2015-06-19 2795 0

Hadoop 分布式/云计算/大数据

P14

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 3530 0

Spark 分布式/云计算/大数据 Java Python Scala

Mahout来快速创建高效扩展性又好的机器学习应用。Mahout结合了诸如H2O算法、Scala、Spark和Hadoop MapReduce等模块，为开发人员提供了一个构建可扩展算法的环境。现在最新的版本是去年11月6日发布的0

jopen 2016-01-18 31229 0

数据挖掘大数据 Github

业的一生/ Spark是时下很火的计算框架，由UC Berkeley AMP Lab研发，并由原班人马创建的Databricks负责商业化相关事务。而SparkSQL则是Spark之上搭建的SQL解决方案，主打交互查询场景。

jopen 2015-12-08 30888 0

SparkSQL

工具。 1. Spark 在Apache的大数据项目中，Spark是最火的一个，特别是像IBM这样的重量级贡献者的深入参与，使得Spark的发展和进步速度飞快。与Spark产生最甜蜜的火

jopen 2015-10-21 51330 0

大数据

P10

smack开发之openfire介绍和部署[1] 前言 Java领域的即时通信的解决方案可以考虑openfire+spark+smack。当然也有其他的选择。 Openfire是基于Jabber协议(XMPP)实现的即时通信服务器端版本，目前建议使用3

1726013735 2014-04-07 3477 0

电话/通讯/IM聊天

实现了。 InfoQ：Yarn会朝着通用资源管理和调度方向发展吧？包括对 MapReduce、Spark 短作业的支持，以及对 Web Service 等长服务的支持王峰：恩。我觉得这是Hadoop社区最大的成长空间，一开始1

jopen 2016-03-02 33897 0

Hadoop

TableInputFormatConfigurator are not affected. The kudu-spark sub-project has been renamed to follow naming conventions

jopen 2016-06-11 10463 0

Hadoop 数据存储 Apache Kudu

能表现。”rnrnApache的流数据处理系统携手Spark，旨在进一步提升性能水平并改进调试功能。rnrn大数据专家们在讨论Apache Spark与Apache Storm之间的流数据处理能力时，

jopen 2016-05-10 9012 0

技术

json：这里面保存了一些metadata的数据，例如对于spark "name": "spark", "description": "Spark is a fast and general cluster

Leonel94P 2016-10-16 12405 0

操作系统 Mesos 软件架构

，有必要记录一下，避免下次遇到时又要重新研究。利用spark读取es数据源的简单示例 import org.elasticsearch.spark.sql._ val esOptions = Map("es

jopen 2016-01-07 22370 0

Hadoop ElasticSearch 搜索引擎 Elastic Search

暴走漫画的Docker实践经验

cpu并行计算集群设计方案文档

基于Flex SDK 4.6.x开发的Flex Theme : SilverGreen 经验

亚马逊推出自己的社交网络不过目前只针对iOS用户资讯

(12)使用数据分区优化join 文档

谈谈分布式计算的算子层经验

基于Scala的产品开发实践经验

攻略：如何用一天时间做一个开源版的Nest 资讯

Spring XD 1.1 RC1 发布资讯

大数据架构师基础：hadoop家族，Cloudera产品系列等各种技术文档

(5)RDDs介绍文档

优秀大数据GitHub项目一览资讯

一个SparkSQL作业的一生资讯

2015 Bossie评选：最佳开源大数据工具资讯

基于xmpp openfire smack开发之openfire介绍和部署文档

专访王峰：Hadoop生态下一代计算引擎-streaming和batch的统一资讯

Apache Kudu v0.9.0 发布，一个数据存储系统资讯

Apache Storm 1.0版本重拳出击：前代版本3倍性能表现资讯

深入解析DC/OS 1.8——高可靠的微服务及大数据管理平台经验

elasticsearch-hadoop使用示例经验

Spark MLLib 的相关搜索

关键词

暴走漫画的Docker实践 经验

cpu并行计算集群设计方案 文档

基于Flex SDK 4.6.x开发的Flex Theme : SilverGreen 经验

亚马逊推出自己的社交网络 不过目前只针对iOS用户 资讯

(12)使用数据分区优化join 文档

谈谈分布式计算的算子层 经验

基于Scala的产品开发实践 经验

攻略：如何用一天时间做一个开源版的Nest 资讯

Spring XD 1.1 RC1 发布 资讯

大数据架构师基础：hadoop家族，Cloudera产品系列等各种技术 文档

(5)RDDs介绍 文档

优秀大数据GitHub项目一览 资讯

一个SparkSQL作业的一生 资讯

2015 Bossie评选：最佳开源大数据工具 资讯

基于xmpp openfire smack开发之openfire介绍和部署 文档

专访王峰：Hadoop生态下一代计算引擎-streaming和batch的统一 资讯

Apache Kudu v0.9.0 发布，一个数据存储系统 资讯

Apache Storm 1.0版本重拳出击：前代版本3倍性能表现 资讯

深入解析DC/OS 1.8——高可靠的微服务及大数据管理平台 经验

elasticsearch-hadoop使用示例 经验