P51

  自己动手写网络爬虫(二) 文档

分布式爬虫 分布式爬虫 第2章 分布式爬虫 随着互联网技术的发展以及风起云涌的云计算浪潮。爬虫技术也逐渐向着分布式方向发展。比如,Google的爬虫就是使用成千上万台小型机和微机进行合作,完成分布式

Wyh_D_Void 2011-05-23   890   0

细细品味大数据--初识hadoop 经验

? Hadoop是一个由 Apache 基金会所开发的 分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。 Hadoop 的框架最核心的设计就是:

jopen 2015-08-30   15444   0

Hadoop主要子项目介绍(Pig Zookeeper Hbase Hive Sqoop Avro Chukwa Cassandra ) 经验

现在Hadoop已经发展成为包含多个子项目的集合。虽然其核心内容是MapReduce和Hadoop分布式文件系统(HDFS),但Hadoop下的Common、Avro、Chukwa、Hive、HBase等子

jopen 2016-01-18   18790   0
P38

  各公司服务器架构 文档

用相应的框架进行开发后,即可做到对外统一界面、统一运维管理、统一报表展示等;也包括分布式缓存、分布式文件系统分布式数据库等通用技术,上层应用可以根据自己的需要使用相应的API就可以使用到这些通用技术。

lxhoyxc 2014-05-05   3818   0
P2

  热点关注:解析云计算的核心技术 文档

  MapReduce是Google开发的java、Python、C++编程模型,它是一种简化的分布式编程模型和高效的任务调度模型,用于大规模数据集(大于1TB)的并行运算。严格的编程模型使云计算环境

jq_one 2011-12-06   499   0
P16

  cpu并行计算集群设计方案 文档

File System,Hadoop分布式文件系统),而整个Hadoop的体系结构主要是通过HDFS来实现分布式存储的底层支持的,并且它会通过MapReduce来实现分布式并行任务处理的程序支持。 4. HDFS的体系结构:

勇敢勒小虎 2017-01-10   2568   0
P8

  HDFS 用户指南 (HDFS Users Guide) 0.21 中文版 文档

1 目的 2 2 概述 2 3 前提 3 4 Web界面 3 5 Shell命令 3 5.1 分布式文件系统管理命令(DFSAdmin Command) 3 6 Secondary NameNode 4

jrx0122 2014-05-25   2393   0
P8

  HDFS用户指南 (HDFS Users Guide)_中文版 文档

1 目的 2 2 概述 2 3 前提 3 4 Web界面 3 5 Shell命令 3 5.1 分布式文件系统管理命令(DFSAdmin Command) 3 6 Secondary NameNode 4

liuhui_sun 2013-10-15   3259   0
P8

  HDFS用户指南 (HDFS Users Guide) 0.21 中文版 文档

1 目的 2 2 概述 2 3 前提 3 4 Web界面 3 5 Shell命令 3 5.1 分布式文件系统管理命令(DFSAdmin Command) 3 6 Secondary NameNode 4

lxz 2014-01-03   1957   0
P8

  HDFS用户指南 (HDFS User Guide)0.21_中文版 文档

1 目的 2 2 概述 2 3 前提 3 4 Web界面 3 5 Shell命令 3 5.1 分布式文件系统管理命令(DFSAdmin Command) 3 6 Secondary NameNode 4

风颖尘 2014-08-14   1904   0
P8

  HDFS 用户指南(HDFS Users Guide)0.21_中文版 文档

1 目的 2 2 概述 2 3 前提 3 4 Web界面 3 5 Shell命令 3 5.1 分布式文件系统管理命令(DFSAdmin Command) 3 6 Secondary NameNode 4

icebingsky 2015-01-06   2901   0
P8

  HDFS 用户指南(HDFS User Guide ) 0.21 中文版 文档

1 目的 2 2 概述 2 3 前提 3 4 Web界面 3 5 Shell命令 3 5.1 分布式文件系统管理命令(DFSAdmin Command) 3 6 Secondary NameNode 4

coco0218 2013-07-11   3059   0
P8

  HDFS 用户指南中文版 文档

1 目的 2 2 概述 2 3 前提 3 4 Web界面 3 5 Shell命令 3 5.1 分布式文件系统管理命令(DFSAdmin Command) 3 6 Secondary NameNode 4

chenfeng_0829 2013-04-17   2826   0

关于云存储系统的六大技术分析 经验

大领域。 云存储是在云计算概念上延伸和发展出来的一个新概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和

P55

  Hadoop入门实战手册 文档

下载 7 3.4 运行Hadoop集群的准备工作 7 3.5 单机模式的操作方法 7 3.6 伪分布式模式的操作方法 8 3.6.1 配置 8 3.6.2 免密码ssh设置 9 3.6.3 执行 9 4

somnus_sta 2012-09-13   629   0
P61

  Hadoop分享 文档

及最新IT资讯等Linux专业类网站。 3. 云计算 云计算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid

jphnny 2016-06-28   640   0

IndexFS: Scaling File System Metadata Performance论文读后感 经验

本身正是CMU的博士生,却得到了best paper,足可见其功力之深。 本文的核心思想就是尝试解决分布式文件系统中metadata (元数据)管理的问题: 比如在做N-N Checkpointing的时候产生的高并发metadata操作;

wcwx 2015-01-03   22143   0

Galaxy 2.0 发布,支撑百度万亿实时连接库 资讯

Galaxy 2.0 发布,此版本更新内容: 支持200TB+容量,实例1400+分布式文件系统调度 支持实例1000+ 分布式表格系统调度 Galaxy是一个数据中心操作系统,目标是最大化资源的利用率与降低应用部署运维代价,

jopen 2015-12-31   6558   0
P15

  Hadoop+Hbase搭建云存储总结 文档

Hadoop+Hbase搭建云存储总结 Hadoop文件系统: Hadoop文件系统是一个能够兼容普通硬件环境的分布式文件系统, 和现有的分布式文件系统不同的地方是Hadoop更注重容错性和兼容廉价的硬

ccop 2013-04-18   537   0

hadoop家族介绍 资讯

http://voidy.net/hadoop_family/ 简介 Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用

jopen 2015-08-31   28652   0
Hadoop  
1 2 3 4 5 6 7 8 9 10