JStorm-介绍 经验

做任何你想做的时,当时很多工作都需要自己亲自动手去实现,如序列化、Topology的生成等。 Spark:基于内存计算的MapReduce模型,偏重于数据批量处理。 5.JStorm架构 从设计层

jopen 2015-09-15   17743   0

MyCat:开源分布式数据库中间件 经验

方便的数据运维工具,实现在线数据扩容、迁移等高级功能。 进一步挺进大数据计算领域,深度结合Spark Stream和Storm等分布式实时流引擎,能够完成快速的巨表关联、排序、分组聚合等OLAP方

jopen 2015-07-16   37977   0
Mycat  

​兔子和分布式机器学习 经验

可移植性是一个更大的困难,要做分布式机器学习必须有分布式的通信框架。而每个分布式系统本身的抽象各不相同, hadoop/spark 做的是 MapReduceabstraction , graphlab 做 graph parallel

gcd8 2015-01-21   34205   0

《京东技术解密》读书笔记:坚持技术十年如一日 经验

" 汉江 "项目:基于Storm提供实时计算API; ③实时查询服务 " 三峡 "项目:基于Spark和PrestoDB解决海量数据下的即时查询; ④实时数据挖掘 " 东海 "项目:将数据挖掘实时化服务线上的推荐和搜索;

jopen 2016-01-10   30257   0
京东  

使用Mesos和Marathon管理Docker集群 经验

99%可用性)。每个额外的9变得越来越难实现。 分布式系统通常是以静态分区,比如Akka/Play、 Spark/Hadoop、Storm和 Redis各自分区分组划分。静态分区带来的缺点是增加复杂性,随着机

jopen 2016-01-03   21454   0
Docker  

MySQL监控利器-Innotop 经验

--socket -S MySQL socket to use for connection --spark Length of status sparkline (default 10) --timestamp

jopen 2016-01-05   8994   0

使用Apache Mesos打造分布式资源调度系统 经验

Meson主要适用于对CPU、内存,以及磁盘空间等资源有着不同要求的作业所组成的异构环境。它可以支持通过一个共享集群运行Spark作业和其他批处理作业。在基于Cgroups的隔离机制帮助下,代理上的不同任务将使用相互隔离的资源

hzatwhed 2016-08-19   35354   0

微店实时计算平台实践 经验

met平台监控报警等还不完善,后续会逐步完善,力争提供一体化的实时数据开发平台。目前比较火热的spark streaming,此外google提出的新一代的数据处理引擎dataflow以及twitte

vbur3840 2017-01-12   26231   0

用大白话聊聊分布式系统 经验

RPC框架。在设计分布式计算时,我们分布式计算可以采用 MapReduce、Apache Hadoop、Apache Spark 等。在大数据和分布式存储方面,我们可以选择 Apache HBase、Apache Cassa

P29

  搜索离线生产集群中的流计算 文档

资源调度管理多种计算模型运行在一个YARN集群上 MapReduce Job, Stream Service, Spark…. 不同计算模型的业务背景不一样,优先级不一样 Capacity Scheduler, Fair

defeqw 2015-11-30   546   0

Android推送方案分析(MQTT/XMPP/GCM) 经验

ogle帐号,受限于Google。 方案2、 使用XMPP协议(Openfire + Spark + Smack) 简介:基于XML协议的通讯协议,前身是Jabber,目前已由IETF国际标准化组织完成了标准化工作。

jopen 2014-09-16   53320   0

Docker 与分布式数据库结合 经验

部署简单,使用镜像部署非常简单,特别是对集群环境,使用Docker镜像的部署还可以再数据库上提前集成Hadoop、Spark等架构,真正实现“一步到位”。 2) 方便应用的更新,应用的更新只需要考虑制作一个新的镜像就

jopen 2015-06-25   27501   0
Docker  

[Apache Kafka]Kafka简介 经验

NoSQL数据库中用于接近实时的分析 实时消费者(real-time consumer):例如Spark或Storm,在内存数据库中过滤信息并触发相关事件 使用Kafka的场景 各种形式的web活

jopen 2015-12-31   22385   0

携程ELK日志分析平台深耕之路 经验

计时间窗,秒级获取聚合计算结果。再也不需要在Hadoop上长久的等待,也不用为更改Storm/Spark定好的计算维度而犯愁,非凡的用户体验一下抓住了用户的心,更多的日志接入需求随之而来。 持续学习、实践与优化

qfkw0998 2016-03-01   60447   0

我们总结了370个免费学习编程的国外大学公开课 经验

Deploying a Hadoop Cluster M233: Getting Started with Spark and MongoDB Foundations of Data Structures Introduction

hd_open 2017-03-08   12697   0

运用 Aggregator 模式实现 MapReduce 经验

方法会在满足聚合条件时,对分析结果进行reduce运算。Scala的集合库自身并没有提供 reduceByKey() 函数,是我模仿Spark的RDD自行编写的隐式转换方法: object MapSeqImplicits { implicit

Stephen0304 2016-09-27   13591   0

你还需要知道的9个大数据技术 经验

这是一种由社区驱动的分布式大数据分析开源框架,类似于Apache Hadoop和Apache Spark。它的引擎可借助数据流和内存中(in-memory)处理与迭代操作改善性能。目前Apache Flink已成为一个顶级项目(Top

Java 8 Lambda限制:闭包 经验

为。 在功能语言中,它通常是有限的,而当它不是,则不鼓励。 考虑你正在使用并行范例,例如在Spark中: int counter = 0; JavaRDDrdd = sc.parallelize(data);

ijxx4750 2017-03-31   16119   0

伯克利AI分布式框架Ray,兼容TensorFlow、PyTorch与MXNet 经验

些解决方案的效果很好,同时 AI 领域之外也存在一些高质量的分布式系统(如 Hadoop 和 Spark),但前沿开发者们仍然常常需要从头构建自己的系统,这意味着需要耗费大量时间和精力。 例如,应

rwv8660 2018-01-10   21345   0

“2015开源技术大会”成功举办,社区参与干货多多 资讯

分会场三的话题更倾向于技术实践共享。京东 PrestoDB、SequoiaDB 巨杉数据库、Spark 技术、腾讯游戏 RapidJSON、Web 开发等悉数登场,在现场掀起了一场关于开源实战技术的讨论热潮。吕信向大家分享了京东

yne7 2015-03-30   14493   0
开源  
1 2 3 4 5 6 7 8 9 10