分布式的内存平台Apache Ignite v1.6.0 发布 资讯

Apache Ignite内存数据组织是高性能的、集成化的以及分布式的内存平台,他可以实时地在大数据集中执行事务和计算,和传统的基于磁盘或者闪存的技术相比,性能有数量级的提升。 特性一览 可以

jopen 2016-05-23   15501   0

Presto:Facebook的分布式SQL查询引擎 资讯

Facebook 是一家数据驱动的公司。 数据处理和分析是 Facebook 为 10 亿多活跃用户开发和交付产品的核心所在。 我门拥有世界上最大的数据仓库之一,存储了大约 300PB 以上的数据。 这些数据被一系列不同种类的程序所使用,

jopen 2013-11-10   26154   0
Presto  

asyncoro 1.3 发布,Python并行分布式框架 资讯

asyncore库是python的一个标准库,它是一个异步 socket的包装。我们操作网络的时候可以直接使用socket等底层的库,但是 asyncore使得我们可以更加方便的操作网络,避免直接使用socket,select,poll等工具时需要面对的复杂。

jopen 2012-09-12   5885   1
Python  

Wisecracke - 高性能的分布式密码分析框架 资讯

Wisecracker是一个利用GPU(图形处理器)和多个CPU的高性能分布式密码分析框架。它可以让安全研究人员写自己的密码分析工具,可以跨多个系统的多个多核处理器和GPU分发暴力破解密码分析工作。.

jopen 2012-11-03   7373   1
P9

  Hbase分布式多结点安装运行手册 文档

Hbase分布式多结点安装运行手册 环境:       操作系统:CentOS5.6,其他版本的Linux应该也可以。       jdk:sun jdk 1.6 32bit       hadoop:apache

lison4open 2015-01-01   340   0
P14

  DMLC 深盟分布式深度机器学习开源平台解析 文档

 DMLC深盟分布式深度机器学习开源平台解析 发表于2015-05-21 14:42| 7992次阅读| 来源《程序员》电子刊| 15 条评论| 作者李沐 陈天奇 王敏捷 余凯 张峥 DMLC深盟机

eefb 2015-09-09   505   0
P57

  分布式搜索+elasticsearch+方案研究+-+基础知识 文档

 分布式搜索 elasticsearch 方案研究 - 基础知识 目 录 分布式搜索elasticsearch几个概念解析 3 分布式搜索elasticsearch单机与服务器环境搭建 4 分布式搜索elasticsearch中文分词集成

jeycash 2016-11-29   4144   0
P13

  分布式key-value存储系统 - Apache Cassandra入门 文档

分布式Key-Value存储系统——Cassandra 入门 Type of Submission: Title: 分布式Key-Value存储系统—— Cassandra 入门 Subtitle:

xnbw 2016-01-11   441   0
P20

  Paxos - 分布式一致性协议 文档

1. Paxos——分布式一致性协议知行学社2012年10月 2. Paxos的理解困境Paxos究竟在解决什么问题? Paxos如何在分布式存储系统中应用? Paxos算法的核心思想是什么? 第一阶段在做什么?

zzh1626 2014-01-12   9652   0
P48

  分布式java应用系列培训--第二天 文档

1. 分布式Java应用系列培训林昊 http://blog.bluedavy.com 2. Just a travel传统的单机应用小型分布式应用中型分布式应用大型分布式应用 3. 一个中型分布式应用

net_wood 2012-05-31   2496   0
P55

  chapter 3 分布式程序设计语言 文档

第三章 分布式程序设计语言 2. 3.1 分布式程序设计语言概述对应用程序进行程序设计的理由: 减少单个计算的周转时间; 增加可靠性和可用性; 使系统的某些部分提供某些特殊功能以及固有的分布式应用。10/22/20182

dejunw 2013-02-05   488   0
P17

  微服务实例-构建分布式爬虫系统-数人科技 文档

1. 自制分布式爬虫系统北京数人科技有限公司 doc.dataman-inc.com 2. 单机的 All-In-One 爬虫架构控制模块抓取模块抽取模块HA Proxy各地代理URLHTML模板结果JSONXML递归

dmc3 2015-07-25   1277   0
网络爬虫   方案   HTTP   HTML   Java  
P15

  Bigtable一个分布式存储系统 文档

Bigtable是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的PB级的数据。Google 的很多项目使用Bigtable存储数据,包括Web索引、Google Earth、Google Finance。这些应用对Bigtable提出的要求差异非常大,无论是在数据量上(从URL到网页到卫星图像)还是在响应速度上(从后端的批量处理到实时数据服务)。尽管应用需求差异很大,但是,针对Google的这些产品,Bigtable还是成功的提供了一个灵活的、高性能的解决方案。本论文描述了Bigtable提供的简单的数据模型,利用这个模型,用户可以动态的控制数据的分布和格式;我们还将描述Bigtable的设计和实现。

denghp 2011-01-03   520   0

Git详解之五 分布式Git 经验

分布式 Git 为了便于项目中的所有开发者分享代码,我们准备好了一台服务器存放远程 Git 仓库。经过前面几章的学习,我们已经学会了一些基本的本地工作流程中所需用到的命令。接下来,我们要学习下如何利用

jopen 2012-02-01   481338   0

PayPal高级工程总监:读完这100篇论文 就能成大数据高手 资讯

Source)用之于大数据技术,其作用有二:一方面,在大数据技术变革之路上,开源在众人之力和众人之智推动下,摧枯拉朽,吐故纳新,扮演着非常重要的推动作用。另一方面,开源也给大数据技术构建了一个异常复杂

jopen 2015-07-07   40256   0
P39

  HBase技术研究与应用分析 文档

中国电信上海理想集团 2. Hadoop系列专题内容: 1、Hadoop是什么? 2、分布式云存储:HDFS 3、并行计算:MapReduce 4、案例:全球眼中的应用 5、Hadoop集群构建规划Hadoop 与分布式计算Hive与

furenjievip 2012-05-23   2616   0

13款开源Java大数据工具 经验

Kiourtzoglou发表文章,从理论到实践剖析了大数据的4个V,并于文章最后分享了Java工程师可能会需要的13个主流开源大数据工具。 大数据几乎已成为所有商业领域共有的最新趋势,然而大数据究竟是什么?是噱头、泡沫,又或是真如传言一样的重要。

jopen 2014-04-30   52548   0
开源  

开源大数据处理系统/工具大全 经验

本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一部分。 查询引擎 一、Phoenix 贡献者:: Salesforce

ew45 2015-03-12   325553   0

Apache Ignite(二):核心特性一览(V1.4.0版本) 经验

能点做详细的说明。 1.数据网格 Ignite内存数据网格是一个内存内的键值存储,他可以在分布式集群的内存内缓存数据。 它通过强语义的数据位置和关系数据路由,来降低冗余数据的噪声,使其可以节点数的线性增长,直至几百个节点。

jopen 2016-01-12   22857   0
P1

  系统设计面试题思路综述 文档

要求设计一个DNS的Cache结构,要求能够满足每秒5000以上的查询,满足IP数据的快速插入,查询的速度要快。(题目还给出了一系列的数据,比如:站点数总共为5000万,IP地址有1000万,等等) (2) 有

wujiuliu 2013-06-01   8501   0
1 2 3 4 5 6 7 8 9 10