Disco是一个基于MapReduce的分布式计算框架。Disco是一个开源项目,由诺基亚研究中心开发用来解决处理大数据时碰到的实际问题。 Disco采用Python开发,具有易于使用,强大的特点
SmartFrog 是一个功能强大而且灵活的用于配置发布和管理分布式软件系统的 Java 平台。 SmartFrog由以下三部分组成: A Language for defining configurations
SharedCache是高性能的、分布式的内存对象系统,用于在动态WEB或Win应用程序中减少数据库的负责,提高访问速度。SharedCache 全部的代码都是用c#写的,100% DotNet原生态。
MyRPC是个远程过程调用框架,设计用来方便地连接异构系统。它具有基于IDL的客户机/服务器存根生成,多平台支持,二进制协议(不需要转义二进制数据,更少的开销),支持各种数据类型(如字符串,二进制,符号和无符号整数,浮点数,列表,结构和枚举),和异常的支持。
Elasticsearch是一个基于lucene的、开源的、分布式的、RESTful的搜索引擎。Elasticsearch有如下特征: 1. 更快的执行搜索; 2. 安装简单; 3. 完全自由的搜索模式;
Ganglia是一个跨平台可扩展的,高 性能计算系统下的分布式监控系统,如集群和网格。它是基于分层设计,它使用广泛的技术,如XML数据代表,便携数据传输,RRDtool用于数据存储和可 视化。它利用精
GridWay 是一个工作负载管理器,用于在一个由不同计算平台组成的 grid 中执行作业管理和资源调配。GridWay 主要任务是大规模、可靠和高效的计算资源分片管理。
的相关文章我已经做了索引,在我的博客中置顶了,大家可以方便的找到。从这一篇开始分布式消息系统的入门。 在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题: l 我想分析一下用户行为(
Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS有着高容错性(fault-tolerent)的特点,并且设计用来部署在低廉的(low- cos
环境,我们会从单机版开始,然后逐渐往分布式扩展。单机版的搭建官网上就有,比较容易实现,这里我就简单介绍下即可,而分布式的搭建官网却没有描述,我们最终的目的还是用分布式来解决问题,所以这部分会是重点。
Zipkin 是 Twitter 的一个开源项目,允许开发者收集 Twitter 各个服务上的监控数据,并提供查询接口。
机制。能够将计算压力分布到多核CPU或集群的多台计算机上,能够非常方便的在内网中搭建一个自组织的分布式计算平台。先从多核计算开始,普通的Python应用程序只能够使用一个CPU进程,而通过Parallel
Apache Giraph 是一个可伸缩的分布式迭代图处理系统,灵感来自 BSP (bulk synchronous parallel) 和 Google 的 Pregel. Giraph 区别于其他项目的是开源、基于
Kochiku 是一个自动化测试系统的分布式平台,包含3个组件: Web 服务器:你可以检视构建和管理资料库 后台作业:将构建切分成多个部分 Workers 用来独立允许某个构建的部分 一般一个单击可运行
Mahout知名度很高,是Apache基金资助的重要项目,Mahout是一个分布式机器学习算法的集合,协同过滤只是其中的一部分。除了被称为Taste的分布式协同过滤的实现(Hadoop-based,另有pure Ja
ModeShape是一个分布式,层次化,事务性的,一致的数据存储。支持查询、全文搜索、事件,版本控制,引用和灵活的动态架构。它非常快的,高度可用,高度可扩展,100%开源和采用Java编写。 客户端使用
分布式锁是一个在很多环境中非常有用的原语, 它是不同进程互斥操作共享资源的唯一方法。有很多的开发库和博客描述如何使用Redis实现DLM(Distributed Lock Manager ),但是每个
Dynamo whitepaper ,是一个轻量级、分布式的 Dynamo 层,用于不同的 K/V 存储和协议。 Dynamo 是 Amazon 公司的一个分布式 存储 引擎。 Dynomite 拓扑结构:
Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。 Katta可用于大量、重复、索引的碎片,以满足高负荷和巨大的数据集。这些索引可以是不同的类型。当前该实现在 Lucene 和 Hadoop
Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为Apache项目的一部分。Kafka是一个分布式的,可划分的,冗余备份的持久性的日志服务。它主要用于处理活跃的流式数据。