开源项目,开源代码,开源文档,开源新闻,开源社区

一般来说，计算机处理的数据都存在一些冗余度，同时数据中间，尤其是相邻数据间存在着相关性，所以可以通过一些有别于原始编码的特殊编码方式来保存数据，使数据占用的存储空间比较小，这个过程一般叫压缩。和压缩对应的概念是解压缩，就是将被压缩的数据从特殊编码方式还原为原始数据的过程。

jopen 2014-10-20 54797 0

分布式/云计算/大数据 Hadoop

1.基础包（包括工具包和安全包）包括工具和安全包。其中，hdfs.util包含了一些HDFS实现需要的辅助数据结构；hdfs.security.token.block和hdfs.security.token.delegation结合Hadoop的安全框架，提供了安全访问HDFS的机制。

jopen 2014-02-18 63842 0

Hadoop 分布式/云计算/大数据

hadoop的运行原理：hadoop主要由三方面组成: 1、HDFS 2、MapReduce 3、Hbase Hadoop框架中最核心的设计就是：MapReduce和H...

jopen 2016-01-10 11195 0

分布式/云计算/大数据

P6

　　节点是通过心跳来告诉master 自己还存活的。而在这之前，我做了一个测试，加了一个新节点到集群中，后来又把节点给删了，hosts（这个hosts应该是指被删除节点的host吧）的文件也被改了，会不会是这个节点还在往master 发送心跳？SSH 到那个新节点上，jps 看一下任务，task tracker 果然还活着！把这个进程kill 掉，问题就OK 了。

yveguo 2013-02-27 2258 0

Hadoop 分布式/云计算/大数据

P32

Hadoop 一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。<br> Hadoop是项目的总称，主要是由分布式存储（HDFS）、分布式计算（MapReduce）组成。<br> Hadoop程序目前只能运行在Linux系统上，window上运行需要安装其他插件，安装过程见《hadoop安装说明.docx》。

orangeking 2012-06-29 8911 0

Hadoop 分布式/云计算/大数据 Apache Java

P36

Hadoop 源起: Apache Lucene 开源的高性能全文检索工具包 Apache Nutch 开源的 Web 搜索引擎 Google 三大论文 MapReduce / GFS / BigTable Apache Hadoop 大规模数据处理 Hadoop 核心: Hadoop Common 分布式文件系统HDFS MapReduce框架

jphnny 2016-06-28 3381 0

Hadoop 分布式/云计算/大数据报告 Apache Go

P38

Hadoop项目简介； HDFS体系结构； HDFS关键运行机制； Hadoop VS.Google（分布式文件系统）； Hadoop API； Hadoop环境搭建。

zoujl 2012-08-29 4332 0

Hadoop 分布式/云计算/大数据方案报告 Apache

P38

Hadoop项目简介； HDFS体系结构； HDFS关键运行机制； Hadoop VS.Google（分布式文件系统）； Hadoop API； Hadoop环境搭建。

aaron509 2012-03-01 4567 0

Hadoop 分布式/云计算/大数据方案报告 Apache

支持平台 GNU/Linux是产品开发和运行的平台。 Hadoop已在有2000个节点的GNU/Linux主机组成的集群系统上得到验证。 Win32平台是作为开发平台支持的。由于分布式操作尚未在Win32平台上充分测试，所以还不作为一个生产平台被支持。所需软件 Linux 和 Windows 所需软件包括 : Java TM 1.5.x，必须安装，建议选择Sun公司发行的Java版本。

jopen 2012-09-06 2803 0

jeecg

著名音乐站点Last.fm发布了基于Python的Dumbo（小飞象）项目，Dumbo能够帮助Python开发者更方便的编写Hadoop应用，并且Dumbo为MapReduce应用提供了灵活易用的Python API。

openkk 2012-06-08 30083 0

Hadoop 存储系统分布式/云计算/大数据

hfds 是一种文件系统，用于存储hadoop将要处理的数据。适用于大规模分布式数据处理，是一个可扩展行的文件分布式系统；

jopen 2013-08-16 49709 0

HDFS 分布式/云计算/大数据

P46

报告内容：Hadoop核心：1、Hadoopdfs（Hdfs），MapReduce分布式并行计算模型。2、Hadoop扩展，Hadoopbase（Hbase）基于hadoop核心的高扩展性分布式数据库。Pig-一种高级数据流语言和并行计算的执行框架，也基于hadoop核心，Hive-建立在hadoop之上的数据仓库基础设施，提供数据摘要，adhocquerying，数据集分析。

huafenged 2011-08-17 4776 0

Hadoop 分布式/云计算/大数据方案报告 HTTP

P38

HDFS为了做到可靠性（reliability）创建了多份数据块（datablocks）的复制（replicas），并将它们放置在服务器群的计算节点中（computenodes），MapReduce就可以在它们所在的节点上处理这些数据了。

xiexiantao 2012-06-20 2317 0

Hadoop 分布式/云计算/大数据方案报告 Apache

P38

HDFS为了做到可靠性（reliability）创建了多份数据块（data blocks）的复制（replicas），并将它们放置在服务器群的计算节点中（compute nodes），MapReduce就可以在它们所在的节点上处理这些数据了。

451237450 2011-11-10 4302 0

云计算 Hadoop 分布式/云计算/大数据方案报告

P38

主要内容Hadoop项目简介HDFS体系结构HDFS关键运行机制Hadoop VS.Google（分布式文件系统）Hadoop API Hadoop环境搭建Hadoop项目简介Apache的解决方案Google云计算MapReduce Big Table

ning042712 2012-12-03 498 0

Hadoop 分布式/云计算/大数据方案报告 Apache

P46

报告内容：Hadoop核心、Hadoopdfs（Hdfs）、MapReduce分布式并行计算模型Hadoop扩展Hadoopbase（Hbase）基于hadoop核心的高扩展性分布式数据库Pig-一种高级数据流语言和并行计算的执行框架，也基于hadoop核心Hive-建立在hadoop之上的数据仓库基础设施，提供数据摘要，adhocquerying，数据集分析。HadoopDFS（HDFS）HDFS:技术背景数据海量化趋势催生了DFS应用单机无法存放，大数据集被分割存储文件系统对跨机器的数据集进行统一管理实现的复杂度远大于本地存储系统，例如：错误处理HDFS是一种实现超大文件的存储，流式数据访问，运行于普通商业集群。

daibiao 2012-06-13 5056 0

Hadoop 分布式/云计算/大数据方案报告 HTTP

Happy 为Jython开发者使用Hadoop框架提供了便利，Happy框架封装了Hadoop的复杂调用过程，让Map-Reduce开发变得更为容易。

openkk 2012-06-08 16928 0

Hadoop 分布式/云计算/大数据

Spark可以直接对HDFS进行数据的读写，同样支持Spark on YARN。Spark可以与MapReduce运行于同集群中，共享存储资源与计算，数据仓库Shark实现上借用Hive，几乎与Hive完全兼容。

jopen 2014-09-23 100810 0

Spark Hadoop 分布式/云计算/大数据

这里将自己在初识hadoop过程中遇到的一些错误做一个简单总结：

openkk 2012-03-05 99244 0

Hadoop 企业服务总线ESB

P129

VirtualBox号称是免费虚拟机软件中最强的，拥有丰富的特色和出色的性能，在虚拟机市场占用重要地位。我们选择它的理由是：*安装程序体积小。相对于同类产品VMWare的四五百兆的体积，VirtualBox只有几十兆的安装程序，安装完成后也只有120多兆，太小巧了。*功能简单实用。配置简单、克隆系统、共享文件、虚拟化等一样不缺*免费。这是最大的诱惑。

beat_it 2013-11-16 525 0

Hadoop 分布式/云计算/大数据

hadoop压缩与解压经验

Hadoop各个类的作用经验

hadoop的运行原理经验

hadoop优化配置文档

Hadoop 学习总结文档

Hadoop / MapReduce讨论与学习文档

Hadoop 介绍 - API 文档

Hadoop 技术讲解文档

Hadoop安装指南博客

Hadoop的Python封装 Dumbo 经验

Hadoop java操作HDFS 经验

云计算之Hadoop 文档

Hadoop 技术讲解文档

Hadoop项目简介文档

Hadoop 技术讲解文档

云计算之Hadoop 文档

Hadoop的Jython封装 Happy 经验

Spark与Hadoop的结合经验

Hadoop 集群常见错误经验

Hadoop 从入门到精通文档

Hadoop招聘数据的相关搜索

关键词

hadoop压缩与解压 经验

Hadoop各个类的作用 经验

hadoop的运行原理 经验

hadoop优化配置 文档

Hadoop 学习总结 文档

Hadoop / MapReduce 讨论与学习 文档

Hadoop 介绍 - API 文档

Hadoop 技术讲解 文档

Hadoop安装指南 博客

Hadoop的Python封装 Dumbo 经验

Hadoop java操作HDFS 经验

云计算之Hadoop 文档

Hadoop 技术讲解 文档

Hadoop项目简介 文档

Hadoop 技术讲解 文档

云计算之Hadoop 文档

Hadoop的Jython封装 Happy 经验

Spark与Hadoop的结合 经验

Hadoop 集群常见错误 经验

Hadoop 从入门到精通 文档

Hadoop招聘数据 的相关搜索

关键词

hadoop压缩与解压经验

Hadoop各个类的作用经验

hadoop的运行原理经验

hadoop优化配置文档

Hadoop 学习总结文档

Hadoop / MapReduce讨论与学习文档

Hadoop 技术讲解文档

Hadoop安装指南博客

Hadoop 技术讲解文档

Hadoop项目简介文档

Hadoop 技术讲解文档

Spark与Hadoop的结合经验

Hadoop 集群常见错误经验

Hadoop 从入门到精通文档

Hadoop招聘数据的相关搜索