用JavaScript阐述MapReduce原理 博客

able。GFS是文件系统相关的,其对后来的分布式文件系统设计具有指导意义;MapReduce是一种并行计算的编程模型,用于作业调度;BigTable是一个用于管理结构化数据的分布式存储系统,构建在G

码头工人 2013-10-15   4778   0
P54

  NoSQL 应用视角扩展性,可用性与可靠性的抉择 文档

NoSQL严格一致是影响扩展性的关键瓶颈 11. NoSQL What基本原理 核心技术 产品分类11 12. CAP理论分布式系统的数据分片不可避免 P为必选 一致性和100%的可用性不可兼得 比如,网络坏了,DB不能用了 DB宕机

noblemoon 2012-03-16   4383   0
P30

  git版本管理器 文档

开源分布式版本控制工具 —— Git 之旅 背景 Git 是一个开源的分布式版本控制软件。在英式英语中,Git 指一个愚笨或者不开心的人,恐怕与 Git 发明人——Linux 教父 Linus Torvalds

1428353237 2016-11-07   658   0

一篇文看懂Hadoop:风雨十年,未来何去何从 资讯

0将资源管理从MapReduce中独立出来变成通用框架后,就从1.0的三层结构演变为了现在的四层架构: 底层——存储层,文件系统HDFS 中间层——资源及数据管理层,YARN以及Sentry等 上层——MapRedu

jopen 2016-03-10   25303   1
Hadoop  
P11

  云计算Hadoop:快速部署Hadoop集群 文档

中未来的霸主地位。   Hadoop简介   Apache Hadoop 是一个软件框架,它可以分布式地操纵大量数据。它于2006年首次提及,由 Google、Yahoo! 和 IBM 等公司支持。可以认为它是一种

pdffile 2013-01-05   503   0

Apache Hadoop 2.0 Alpha 发布 资讯

Hadoop并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架。 Apache Hadoop 2.0 今天发布了首个 alpha 版本,该版本

jopen 2012-05-27   18210   1

云数据迁移移工具 Sqoop 1.4.0-incubating 发布 资讯

的数据导入到关系型数据库中。Hadoop并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架。 Apache Sqoop 1.4.0 主要新特性有:

fmms 2011-11-29   20318   1
Hadoop  

JPA 持久层框架 DataNucleus Access Platform 3.0.3 发布 资讯

form/ Hadoop并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架。

openkk 2011-11-05   8947   0

数据仓库平台 Apache Hive 0.8.0 发布 资讯

元数据的持久化等。 Hadoop并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架。 Apache Hive 0.8.0 发布了,发行说明请看

jopen 2011-12-19   15283   0
Hive  

Hadoop + HBase + Solr = Lily 开源项目

文物数据库,新闻管理系统,内容收集系统,数字资产管理,结构化数据管理。 Hadoop提供分布式文件系统,HBase是一个运行在Hadoop之上的No-SQL数据库。HBase具有可伸缩和自动切片功

码头工人 2019-01-17   1174   0
P55

  NoSQL 大数据时代的机遇和挑战 文档

台实时风险预警分析预测个性化服务互联网微博推送网盘/云存储服务照片/视频/音频服务社交动态推送电商服务社交动态推送数据成为业务发展的核心银行提供所有历史交易信息查询 航空根据机票信息分析用户属性,并提

x56080 2015-11-13   2606   0
NoSQL数据库   方案   JSON   Go   Basic  

Jafka - 一个高性能的消息系统 经验

Jafka 是一个高性能的分布式消息系统。Jafka已经开源,使用github托管,主页地址: https://github.com/adyliu/jafka Jafka 1.0版本已经发布,同步到Maven中央仓库。

jopen 2012-06-02   31586   0

Lucene4.0 / Solr 4.0 的新特性 资讯

positions 在索引的编码方式 增加了不同的相关排名系统 增加了用于支持 append-only 文件系统的编码 (例如 Hadoop DFS). 增加 DirectSpellChecker 可直接从 Levenshtein

jopen 2012-07-07   13902   0
Google  

我的编程之路——知识管理与知识体系 经验

一类是理论:算法,数据结构,复杂度,机器学习,模式识别,等等等。一类是系统:操作系统,网络系统,分布式系统,存储系统,游戏引擎,等等等等。粗浅的说,学界会偏向前者,产界偏向后者,笔者作为一只一直读书的

mango_yao 2016-06-29   67627   0
Java  

机器学习(Machine Learning)&深度学习(Deep Learning)资料 经验

understand things. You just get used to them." 分布式并行处理的数据 介绍:这是一本关于分布式并行处理的数据《Explorations in Parallel Distributed

b36g 2015-04-04   474372   0

XCel 项目总结:Electron 与 Vue 的性能优化 经验

用以剔除异常数据,保证数据结果的信度和效度。目前因调研数据和轻量级数据的多变性,对轻量级数据清洗往往采取人工清洗,缺少统一、标准的清洗流程,但对于调研和轻量级的数据往往是需要保证数据稳定性的,因此,在

mkoaa1 2017-03-01   12592   0

微软必应设计经理李毓修:设计师唯有愉悦自己,才能取悦用户 资讯

研究。他们每两个礼拜就挑出一张照片来,分析这个照片到底是怎样跟用户的生活和情感建立连接的。 了解用户,才能做出适合他们的产品 李毓修非常重视用户调研的数据,比如在去年的时候,美国必应团队重

jopen 2015-01-31   4846   0
微软  
P11

  Hadoop在ubuntu下安装配置手册 文档

的目录,设置hadoop的堆大小为2000。 4) 配置ssh无密码登录信息 在 Hadoop 分布式环境中,NameNode主节点需要通过 SSH 来启动和停止DataNode从节点上的各类进程。我

li270606338 2013-08-28   2926   0
P7

  Hadoop实战-初级部分 之 Hadoop IO 文档

Shell 基本操作介绍 第五部分:Hadoop 分布式文件系统1 第五部分:Hadoop 分布式文件系统2 第五部分:Hadoop 分布式文件系统3 第六部分:MapReduce 开发1 第六部分:MapReduce

singing 2014-01-07   2012   0

Apache Spark:大数据处理统一引擎 经验

队开始了Apache Spark项目,旨在为分布式数据处理设计一个统一的引擎。 Spark具有类似于MapReduce的编程模型,但是使用称为“弹性分布式数据集”或RDDs的数据共享抽象扩展。通过这个

MorStarns 2016-12-05   9296   0
1 2 3 4 5 6 7 8 9 10