暴走漫画的Docker实践 经验

直接由Kafka一端的Logstash存储到Elasticsearch(跑在Docker中)中。 一份COPY 经过Spark(跑在Docker中)Stream做实时处理(包括一些特定日志的提取),然后将处理的结果存储在 Elasticsearch

jopen 2015-10-05   35557   0
Docker  
P16

  cpu并行计算集群设计方案 文档

通过将集群管理一般化,研究转到分布式计算的一般化上,来扩展了MapReduce的初衷。 7. Spark是基于内存计算的,是云计算领域继Hadoop之后下一代最热门并行计算框架开源项目,它的核心是弹性分布式数据集(RDD)。

勇敢勒小虎 2017-01-10   2568   0

基于Flex SDK 4.6.x开发的Flex Theme : SilverGreen 经验

特点: 1、基于Flex SDK 4.6.x 2、包含spark和mx组件 3、所有组件均由代码实现(非Flash制作) 4、源代码开放 测试: http://www.k-zone

openkk 2012-08-20   72904   0

亚马逊推出自己的社交网络 不过目前只针对iOS用户 资讯

雅虎网站博客写手丹尼尔-豪利(Daniel Howley)专门体验了亚马逊推出的社交网络 Amazon Spark,并撰文描述了使用该社交网络的体验。下面是他的这篇文章全文: 据外媒报道,无论在哪里你都可以

jopen 2017-07-19   7283   0
P12

  (12)使用数据分区优化join 文档

我们提供专业的大数据学习视频,包括Hadoop,Spark,Storm,Mahout,机器学习等。 我们定价合理,让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。 本系列课

ngn6 2015-08-12   548   0

谈谈分布式计算的算子层 经验

该说,无论是Spark,Summingbird,还是Pig,都在尝试做同一件事情: 借助自己的DSL或原语在流式和批量两套引擎上表达(近)实时和离线数据处理能力 。 Spark本身依赖RDD,实现了Spark

jopen 2015-01-16   18290   0

基于Scala的产品开发实践 经验

: 我们选择了Spark作为我们的大数据分析平台。基于目前的应用场景,主要使用了Spark SQL,目前使用的版本为Spark 1.5.0。我们有计划去同步升级Spark最新版本。 在研发期间,我们从Spark

ohew2481 2017-03-13   28958   0

攻略:如何用一天时间做一个开源版的Nest 资讯

,神马硬件都是浮云。买不到?太贵?不用担心,我们来自己动手做一个。 来自于开源硬件领域的 Spark 已经利用自家的产品把这事搞定了,而且只是 3 个工程师花了一天的时间,成本也不过几十美金。让我们一起来看看他们是怎么做到的。

jopen 2014-01-20   6125   0
开源  

Spring XD 1.1 RC1 发布 资讯

Observable API 和 Spark Streaming(支持现有的 Spark job)进行流处理。通过提供一系列的选项,你可以选择最适合任务的函数式编程模块。 Spark Streaming 集成特性如下:

b4c2 2015-01-29   8339   0
P6

  大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术 文档

2014-07-16 13:51 大 数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来。为了能够更好的架构大 数据项目,这里整理一下,供

tony2007 2015-06-19   2795   0
P14

  (5)RDDs介绍 文档

我们提供专业的大数据学习视频,包括Hadoop,Spark,Storm,Mahout,机器学习等。 我们定价合理,让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。 本系列课

ngn6 2015-08-12   3530   0

优秀大数据GitHub项目一览 资讯

Mahout来快速创建高效扩展性又好的机器学习应用。Mahout结合了诸如H2O算法、Scala、Spark和Hadoop MapReduce等模块,为开发人员提供了一个构建可扩展算法的环境。现在最新的版本是去年11月6日发布的0

jopen 2016-01-18   31229   0

一个SparkSQL作业的一生 资讯

业的一生/ Spark是时下很火的计算框架,由UC Berkeley AMP Lab研发,并由原班人马创建的Databricks负责商业化相关事务。而SparkSQL则是Spark之上搭建的SQL解决方案,主打交互查询场景。

jopen 2015-12-08   30888   0

2015 Bossie评选:最佳开源大数据工具 资讯

工具。 1. Spark 在Apache的大数据项目中,Spark是最火的一个,特别是像IBM这样的重量级贡献者的深入参与,使得Spark的发展和进步速度飞快。 与Spark产生最甜蜜的火

jopen 2015-10-21   51330   0
P10

  基于xmpp openfire smack开发之openfire介绍和部署 文档

smack开发之openfire介绍和部署[1] 前言 Java领域的即时通信的解决方案可以考虑openfire+spark+smack。当然也有其他的选择。 Openfire是基于Jabber协议(XMPP)实现的即时通信服务器端版本,目前建议使用3

1726013735 2014-04-07   3477   0

专访王峰:Hadoop生态下一代计算引擎-streaming和batch的统一 资讯

实现了。 InfoQ:Yarn会朝着通用资源管理和调度方向发展吧?包括对 MapReduce、Spark 短作业的支持,以及对 Web Service 等长服务的支持 王峰:恩。我觉得这是Hadoop社区最大的成长空间,一开始1

jopen 2016-03-02   33897   0
Hadoop  

Apache Kudu v0.9.0 发布,一个数据存储系统 资讯

TableInputFormatConfigurator are not affected. The kudu-spark sub-project has been renamed to follow naming conventions

jopen 2016-06-11   10463   0

Apache Storm 1.0版本重拳出击:前代版本3倍性能表现 资讯

能表现。”rnrnApache的流数据处理系统携手Spark,旨在进一步提升性能水平并改进调试功能。rnrn大数据专家们在讨论Apache Spark与Apache Storm之间的流数据处理能力时,

jopen 2016-05-10   9012   0
技术  

深入解析DC/OS 1.8——高可靠的微服务及大数据管理平台 经验

json:这里面保存了一些metadata的数据,例如对于spark "name": "spark", "description": "Spark is a fast and general cluster

Leonel94P 2016-10-16   12405   0

elasticsearch-hadoop使用示例 经验

,有必要记录一下,避免下次遇到时又要重新研究。 利用spark读取es数据源的简单示例 import org.elasticsearch.spark.sql._ val esOptions = Map("es

jopen 2016-01-07   22370   0
1 2 3 4 5 6 7 8 9 10