开源项目,开源代码,开源文档,开源新闻,开源社区

做任何你想做的时，当时很多工作都需要自己亲自动手去实现，如序列化、Topology的生成等。 Spark：基于内存计算的MapReduce模型，偏重于数据批量处理。 5.JStorm架构从设计层

jopen 2015-09-15 17743 0

方便的数据运维工具，实现在线数据扩容、迁移等高级功能。进一步挺进大数据计算领域，深度结合Spark Stream和Storm等分布式实时流引擎，能够完成快速的巨表关联、排序、分组聚合等OLAP方

jopen 2015-07-16 37977 0

可移植性是一个更大的困难，要做分布式机器学习必须有分布式的通信框架。而每个分布式系统本身的抽象各不相同， hadoop/spark 做的是 MapReduceabstraction ， graphlab 做 graph parallel

gcd8 2015-01-21 34205 0

机器学习

" 汉江 "项目：基于Storm提供实时计算API； ③实时查询服务 " 三峡 "项目：基于Spark和PrestoDB解决海量数据下的即时查询； ④实时数据挖掘 " 东海 "项目：将数据挖掘实时化服务线上的推荐和搜索；

jopen 2016-01-10 30257 0

京东

99%可用性)。每个额外的9变得越来越难实现。分布式系统通常是以静态分区，比如Akka/Play、 Spark/Hadoop、Storm和 Redis各自分区分组划分。静态分区带来的缺点是增加复杂性，随着机

jopen 2016-01-03 21454 0

Docker

--socket -S MySQL socket to use for connection --spark Length of status sparkline (default 10) --timestamp

jopen 2016-01-05 8994 0

MySQL 数据库服务器

Meson主要适用于对CPU、内存，以及磁盘空间等资源有着不同要求的作业所组成的异构环境。它可以支持通过一个共享集群运行Spark作业和其他批处理作业。在基于Cgroups的隔离机制帮助下，代理上的不同任务将使用相互隔离的资源

hzatwhed 2016-08-19 35354 0

Mesos 项目构建

met平台监控报警等还不完善，后续会逐步完善，力争提供一体化的实时数据开发平台。目前比较火热的spark streaming，此外google提出的新一代的数据处理引擎dataflow以及twitte

vbur3840 2017-01-12 26231 0

实时计算 JStorm SQL 软件架构

RPC框架。在设计分布式计算时，我们分布式计算可以采用 MapReduce、Apache Hadoop、Apache Spark 等。在大数据和分布式存储方面，我们可以选择 Apache HBase、Apache Cassa

BQCBrent 2017-03-07 12825 0

分布式系统分布式/云计算/大数据

P29

资源调度管理多种计算模型运行在一个YARN集群上 MapReduce Job, Stream Service, Spark…. 不同计算模型的业务背景不一样，优先级不一样 Capacity Scheduler, Fair

defeqw 2015-11-30 546 0

搜索引擎 SQL

ogle帐号，受限于Google。方案2、使用XMPP协议（Openfire + Spark + Smack）简介：基于XML协议的通讯协议，前身是Jabber，目前已由IETF国际标准化组织完成了标准化工作。

jopen 2014-09-16 53320 0

Android Android开发移动开发

部署简单，使用镜像部署非常简单，特别是对集群环境，使用Docker镜像的部署还可以再数据库上提前集成Hadoop、Spark等架构，真正实现“一步到位”。 2）方便应用的更新，应用的更新只需要考虑制作一个新的镜像就

jopen 2015-06-25 27501 0

Docker

NoSQL数据库中用于接近实时的分析实时消费者（real-time consumer）：例如Spark或Storm，在内存数据库中过滤信息并触发相关事件使用Kafka的场景各种形式的web活

jopen 2015-12-31 22385 0

Kafka 消息系统

计时间窗，秒级获取聚合计算结果。再也不需要在Hadoop上长久的等待，也不用为更改Storm/Spark定好的计算维度而犯愁，非凡的用户体验一下抓住了用户的心，更多的日志接入需求随之而来。持续学习、实践与优化

qfkw0998 2016-03-01 60447 0

Logstash 日志分析日志处理

Deploying a Hadoop Cluster M233: Getting Started with Spark and MongoDB Foundations of Data Structures Introduction

hd_open 2017-03-08 12697 0

软件开发

方法会在满足聚合条件时，对分析结果进行reduce运算。Scala的集合库自身并没有提供 reduceByKey() 函数，是我模仿Spark的RDD自行编写的隐式转换方法： object MapSeqImplicits { implicit

Stephen0304 2016-09-27 13591 0

MapReduce Scala 算法

这是一种由社区驱动的分布式大数据分析开源框架，类似于Apache Hadoop和Apache Spark。它的引擎可借助数据流和内存中(in-memory)处理与迭代操作改善性能。目前Apache Flink已成为一个顶级项目(Top

疯狂的蜗牛 2016-10-19 8756 0

大数据分布式系统分布式/云计算/大数据

为。在功能语言中，它通常是有限的，而当它不是，则不鼓励。考虑你正在使用并行范例，例如在Spark中： int counter = 0; JavaRDDrdd = sc.parallelize(data);

ijxx4750 2017-03-31 16119 0

Lambda 闭包 Java8 Java开发

些解决方案的效果很好，同时 AI 领域之外也存在一些高质量的分布式系统（如 Hadoop 和 Spark），但前沿开发者们仍然常常需要从头构建自己的系统，这意味着需要耗费大量时间和精力。例如，应

rwv8660 2018-01-10 21345 0

分布式系统 AI TensorFlow Pytorch

分会场三的话题更倾向于技术实践共享。京东 PrestoDB、SequoiaDB 巨杉数据库、Spark 技术、腾讯游戏 RapidJSON、Web 开发等悉数登场，在现场掀起了一场关于开源实战技术的讨论热潮。吕信向大家分享了京东

yne7 2015-03-30 14493 0

开源

Spark MLLib 的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

MySQL SQL Android 搜索引擎移动开发消息系统 MapReduce 大数据机器学习项目构建 Kafka Docker Java开发软件架构 Mesos Logstash 日志分析 Android开发 TensorFlow JStorm Java8 分布式系统实时计算 Pytorch 日志处理数据库服务器分布式/云计算/大数据 Lambda Mycat 软件开发

JStorm－介绍经验

MyCat：开源分布式数据库中间件经验

兔子和分布式机器学习经验

《京东技术解密》读书笔记：坚持技术十年如一日经验

使用Mesos和Marathon管理Docker集群经验

MySQL监控利器-Innotop 经验

使用Apache Mesos打造分布式资源调度系统经验

微店实时计算平台实践经验

用大白话聊聊分布式系统经验

搜索离线生产集群中的流计算文档

Android推送方案分析（MQTT/XMPP/GCM）经验

Docker 与分布式数据库结合经验

[Apache Kafka]Kafka简介经验

携程ELK日志分析平台深耕之路经验

我们总结了370个免费学习编程的国外大学公开课经验

运用 Aggregator 模式实现 MapReduce 经验

你还需要知道的9个大数据技术经验

Java 8 Lambda限制：闭包经验

伯克利AI分布式框架Ray，兼容TensorFlow、PyTorch与MXNet 经验

“2015开源技术大会”成功举办，社区参与干货多多资讯

Spark MLLib 的相关搜索

关键词

JStorm－介绍 经验

MyCat：开源分布式数据库中间件 经验

​兔子和分布式机器学习 经验

《京东技术解密》读书笔记：坚持技术十年如一日 经验

使用Mesos和Marathon管理Docker集群 经验

MySQL监控利器-Innotop 经验

使用Apache Mesos打造分布式资源调度系统 经验

微店实时计算平台实践 经验

用大白话聊聊分布式系统 经验

搜索离线生产集群中的流计算 文档

Android推送方案分析（MQTT/XMPP/GCM） 经验

Docker 与分布式数据库结合 经验

[Apache Kafka]Kafka简介 经验

携程ELK日志分析平台深耕之路 经验

我们总结了370个免费学习编程的国外大学公开课 经验

运用 Aggregator 模式实现 MapReduce 经验

你还需要知道的9个大数据技术 经验

Java 8 Lambda限制：闭包 经验

伯克利AI分布式框架Ray，兼容TensorFlow、PyTorch与MXNet 经验

“2015开源技术大会”成功举办，社区参与干货多多 资讯

Spark MLLib 的相关搜索

关键词

JStorm－介绍经验

MyCat：开源分布式数据库中间件经验

兔子和分布式机器学习经验

《京东技术解密》读书笔记：坚持技术十年如一日经验

使用Mesos和Marathon管理Docker集群经验

使用Apache Mesos打造分布式资源调度系统经验

微店实时计算平台实践经验

用大白话聊聊分布式系统经验

搜索离线生产集群中的流计算文档

Android推送方案分析（MQTT/XMPP/GCM）经验

Docker 与分布式数据库结合经验

[Apache Kafka]Kafka简介经验

携程ELK日志分析平台深耕之路经验

我们总结了370个免费学习编程的国外大学公开课经验

你还需要知道的9个大数据技术经验

Java 8 Lambda限制：闭包经验

“2015开源技术大会”成功举办，社区参与干货多多资讯