Hadoop 2.1.0 beta 发布,HDFS提供SnapShot模块 资讯

Hadoop 2.1.0 Beta 版 HDFS 提供了SnapShot 模块。用于数据备份、回滚,以防止因用户的失误操作导致集群出现问题。本文先做一个简单的介绍,其他的文章在来介绍Snapshot 本身的实现机制。

jopen 2013-08-28   9095   0
Hadoop  

贾扬清:希望Caffe成为深度学习领域的Hadoop 资讯

所以C++比Python和Matlab更加容易集成一些。当然,因为C++本身的缘故,所以 实现一些数据的预处理比Matlab和Python要更困难一些。对于C++的话,可能就是多读Caffe的源代码吧:)

jopen 2015-07-07   40649   0
Hadoop  

大象的崛起!Hadoop七年发展风雨录 资讯

与Google还是处在强烈竞 争关系时候,招聘了Doug(Hadoop创始人),把Google老大赖以生存的DFS与Map-Reduce开源了,开始了Hadoop的童年时期。 差不多在2008年的时候,Hadoop才算逐渐成熟。

fmms 2011-09-11   30305   4

华为在Hadoop重要贡献公司名单内,排在Google和Cisco之前 资讯

Yahoo新成立的Hadoop公司Hortonworks,开始与Cloudera争夺领导者地位。 Hortonworks最近发布“Yahoo对Hadoop贡献”一文,标榜Yahoo是Hadoop最大贡献者,Cloudear

fmms 2011-10-08   8423   0
Hadoop  

eBay使用Hadoop和HBase成功构建下一代搜索 资讯

eBay 在 Hadoop 世界(Hadoop World)大会 的主题演讲中展示了一种全新的搜索引擎 Cassini 的架构,该引擎预计在2012年上线。它对所有的内容和用户的元数据进行索引来得到更好的排名,并每小时刷新索引。它使用

码头工人 2011-11-23   15897   0
Hadoop   HBase  

Facebook使用Corona提升Hadoop的可伸缩性 资讯

Corona Improves Hadoop Scalability At Facebook Facebook 已经 开源了 Corona ,这是一款内部开发的用以改善 Hadoop MapReduce 调度的软件。

jopen 2012-11-22   6643   0
P14

  基于Ubuntu14.04 的 Hadoop2.2 集群安装与配置 文档

 基于Ubuntu14.04的Hadoop2.2集群 安装与配置 基于Ubuntu的Hadoop集群安装与配置 一、目的 1、 掌握Hadoop原理机制,熟悉Hadoop集群体系结构、核心技术。 2、安装和配置Hadoop集群。

李新广 2015-07-10   4006   0

Apache Hadoop YARN的一个抽象层:Twill 经验

Twill是 Apache Hadoop YARN 的一个抽象层。它能够减少开发分布应用程序的复杂性,让开发人员可以更加关注他们的业务逻辑。它通过一个类似于Java线程的简单而直观的编程模型来暴露 Apache

jopen 2013-12-11   18505   0

lucene + hadoop 分布式搜索运行框架:Nut 经验

计算为核心的架构设计是Nut区别于Solr、Katta的地方。 Nut是一个Lucene+Hadoop分布式并行计算搜索框架,能对千G以上索引提供7*24小时搜索服务。在服务器资源足够的情况下能达到每秒处理100万次的搜索请求。

jopen 2014-01-02   13759   0

基于Hadoop的海量图片存储模型 的分析和设计 经验

目前国内外在面对图片存储问题时,所采取的解决方案有两种,分别是图片保存至数据库和图片存储在硬盘。鉴于海量图片规模下,数据库承载太多图片会导致数据库容量和效率成为极大的瓶颈。常见的做法是图片保存至硬盘,数据库中保存图片的存储路径。分布式存储

jopen 2014-01-02   84435   0
Hadoop  

Hadoop2.2.0中HDFS的高可用性实现原理 经验

Hadoop2.0.0之前,NameNode(NN)在HDFS集群中存在单点故障(single point of failure),每一个集群中存在一个NameNode,如果NN所在的机器出现了故障

jopen 2014-04-22   78538   0

hadoop-2.4.0完全分布式集群搭建 经验

新版本日志系统预计存储在TB级别,并且需要统计分析一些数据(离线统计,非即时),所以选择廉价linux服务器搭建一个hadoop集群,1个namenode,1个resourcemanager(mapreduce新框架yarn,去掉了原来的

jopen 2014-05-08   44807   0

Hadoop 进行分布式并行编程, 第 1 部分 经验

Hadoop 简介 Hadoop 是一个开源的可运行于大规模集群上的分布式并行编程框架,由于分布式存储对于分布式编程来说是必不可少的,这个框架中还包含了一个分布式文件系统 HDFS( Hadoop

jopen 2014-01-23   40789   0
P20

  分布式计算开源框架Hadoop入门实践 文档

分布式计算开源框架Hadoop介绍 ── 分布式计算开源框架Hadoop入门实践(一) 在SIP项目设计的过程中,对于它庞大的日志在开始时就考虑使用任务分解的多线程处理模式来分析统计,在我从前写的文章《Tiger

softmind 2011-10-08   6215   0

hadoop 学习笔记:mapreduce框架详解 经验

hadoop 学习笔记:mapreduce框架详解 开始聊mapreduce,mapreduce是hadoop的计算框架,我 学hadoop是从hive开始入手,再到hdfs,当我学习hdfs

jopen 2014-08-29   30078   0

Hadoop2.5.0完全分布式配置(1主3从) 经验

open-open.com/lib/view/open1409640189307.html 2 、 Hadoop 节点配置 在讲解之前,先声明一点,这篇文章的所有环境都是基于上一篇伪分布的配置文章的基础

jopen 2014-11-22   27139   0

提高hadoop的mapreduce job效率笔记—–修改mapper和reducer数量 经验

hadoop 的mapreduce 的作业在运行过程中常常碰到一些这样的情况: 每一个map或者reduce只有30-40秒钟就结束 超大规模的job 时,通常会需要大量的map和reduce的slots

jopen 2016-01-16   7166   0

Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作等 经验

HadoopDemo Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用等 运行环境: java 1.8 hadoop1.1.2

jopen 2015-12-04   19595   0

Hadoop2.6.0上的spark1.5.2集群搭建 经验

Spark 安装前提 安装 Spark 之前需要先安装 Hadoop 集群,因为之前已经安装了 hadoop ,所以我直接在之前的 hadoop 集群上安装 spark ,但是因为机器内存不够,我只选择

yvdyyn805 2016-01-27   45467   0

hadoop再次集群搭建(2)-配置免秘钥ssh登录 经验

key)实现基于git协议(底层使用SSH)远程库管理。 SSH(Secure Shell)是一个提供数据通信安全、远程登录、远程指令执行等功能的安全网络协议,由芬兰赫尔辛基大学研究员Tatu Ylöne

jopen 2016-01-18   16615   0
1 2 3 4 5 6 7 8 9 10