type: local gateway的类型,默认为local即为本地文件系统,可以设置为本地文件系统,分布式文件系统,hadoop的HDFS,和amazon的s3服务器,其它文件系统的设置方法下次再详细说。
spresso-linkin-nosql Espresso 是一个来自LinkedIn的分布式NoSQL数据库,其具有高性能、高扩展性、支持事务、容错能力等重要特征。在LinkedIn,Esp
OOGLE分布式数据库技术发展情况,以此作为礼物献给自己,聊以自慰,由于时间有限,加之对于GOOGLE的分布式数据库理解也只能盲人摸象,难免有错误之处,敬请谅解。 GOOGLE的分布式数据库系统从
Brushfire是一个框架用于决策树集成模型的 分布式 监督学习。 Brushfire 当前支持: binary and multi-class classifiers numeric features
distributed service framework based on netty(基于netty的分布式服务框架) 项目主页: http://www.open-open.com/lib/vi
gokit是Go语言分布式编程工具箱。服务于现代服务型企业的需求。 目标 可插拔的序列化和传输 - 不只是 JSON over HTTP Play nicely in common infrastructures
io实例承载能力有限,本文将介绍如何通过nginx+redis+socket.io的组合搭建一个分布式web推送服务器。 socket.io是目前较为流行的web实时推送框架,其基于nodejs语言开发,底层用engine
配置的环境下继续往下添加 HBase 的分布式配置,这次我的 HBase 安装目录放在跟 Hadoop 同一目录下面,节点信息跟我前一篇 Hadoop 完全分布式配置完全一样,不清楚的话可以参考我那篇文章。
Petuum 是 一个机器学习专用分布式计算框架,本文介绍其架构,并基于文章 More Effective Distributed ML via a Stale Synchronous Parallel
Minos 是小米公司开发的一个分布式的发布和监控系统。最初是小米开发的用来在 Hadoop 和 ZooKeeper 集群上发布和管理的工具。Minos 可轻松扩展来支持其他的系统,目前已经支持包括 HDFS、YARN
lab所开源的类Hadoop MapReduce的通用的并行计算框架, Spark基于map reduce算法实现的分布式计算 ,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间
TDW,腾讯分布式数据仓库项目,在Hadoop的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracle功能兼容的SQL语法,支持PB及的存储和TB及的计算等。 这个项目主要的应用场景是
Redisson - 提供基于Redis服务器构建的分布式和可扩展的Java数据结构(Set, SortedSet, Map, ConcurrentMap, List, Queue, Deque, Lock
介绍: 一个轻量化的分布式服务框架,相信这类框架已经不是什么新鲜事物,可用的替代方案有很多这里就不多说了,说一下RSF解决的问题把。 1.分布式 这个是基本功能之一,消费者会自动轮询本
Teleport是一款适用于分布式系统的高并发API框架,它采用socket全双工通信,实现S/C对等工作,支持长、短两种连接模式,支持断开后自动连接与手动断开连接,内部数据传输格式为JSON。 框架模型
框架概况: LTS是一个轻量级分布式任务调度框架。有三种角色, JobClient, JobTracker, TaskTracker。各个节点都是无状态的,可以部署多个,来实现负载均衡,实现更大的负载量
Orbit是一个现代Java框架,用于轻松构建和维护分布式,安全和可扩展的在线服务。 Orbit 包含两个主要组件: Orbit Actors, 一个框架使用虚拟actors来编写分布式系统. Orbit Container
MapReduce概述 MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题。 MR由两个阶段组成:Map和Reduce,用户只需要实现map(
Nucleus (rDSN) 是用于快速构建的,管理高性能,健壮的分布式系统。 rDSN 的早期版本在 Bing 中使用,用来构建分布式数据服务,在线系统运行的很好。根据用户的反馈,rDSN 进行了一些改进,现在使用
Apache Kafka 是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为Apache项目的一部分。Kafka是一种快速、可扩展的、设计内在就是分布式的,分区的和可复制的提交日志服务。