开源项目,开源代码,开源文档,开源新闻,开源社区

P18

name.dir，dfs.data.dir参数，hadoop存放数据文件，名字空间等的目录，格式化分布式文件系统时会格式化这个目录。这里指向了/hadoop，所以也要创建这个目录，并且用户归属也是hadoop:hadoop。

huafenged 2011-08-17 4456 0

Hadoop 分布式/云计算/大数据

P18

name.dir，dfs.data.dir参数，hadoop存放数据文件，名字空间等的目录，格式化分布式文件系统时会格式化这个目录。这里指向了/hadoop，所以也要创建这个目录，并且用户归属也是hadoop:hadoop。

li270606338 2013-08-28 4101 0

Hadoop 分布式/云计算/大数据

系统一般都会设计一套管理这些小图片的分布式存储系统，例如淘宝的TFS文件系统，它是专门针对图片使用的分布式文件系统，这些文件系统里存储的图片会和商家紧密关联，这就让图片本身拥有了一定的动态属性，但

jopen 2015-02-12 13488 0

网站

由Hortonworks公司负责提供支持。 HDFS (即Hadoop分布式文件系统) Hadoop分布式文件系统提供一套基础框架，专门用于拆分收集自不同节点之间的数据，并利用复制手段在节

jopen 2015-03-19 29675 0

Hadoop 分布式/云计算/大数据

python sys)读一个本地文件，逐行处理（例如word count，或者处理log）遍历本地文件系统(sys, os, path)，例如写一个程序统计一个目录下所有文件大小并按各种条件排序并保存结果

openkk 2011-10-22 117099 79

程序员 C/C++ PHP Go SQLite

、ipc 、mnt 、uts 、user 等namespace将container的进程、网络、消息、文件系统、UTS("UNIX Time-sharing System")和用户空间隔离开。 1) pid

jopen 2014-12-27 53505 0

Docker

P8

python sys)读一个本地文件，逐行处理（例如word count，或者处理log）遍历本地文件系统(sys, os, path)，例如写一个程序统计一个目录下所有文件大小并按各种条件排序并保存结果

huzh_68 2011-09-13 489 0

P16

ce任务。通常作业的输入和输出都会被存储在文件系统中。整个框架负责任务的调度和监控，以及重新执行已经失败的任务。通常，MapReduce框架和分布式文件系统是运行在一组相同的节点上的，也就是说，计算

banny 2014-04-09 285 0

。系统不需要 SQL，不需要关系式数据库。所有的数据都作为“对象”，保存在一个分布式的数据空间。系统不需要“文件系统”。所有的数据，包括“进程上下文”自动被“版本控制”，在合适的时候作为对象同步到

jopen 2013-03-07 6164 0

Oberon

？为了实现写时复制（copy-on-write），容器会使用一种名为叠加（overlay）文件系统的特性。即需要对根镜像进行修改时，容器会利用这一特性，将变更内容写入到独立区域并“覆盖”原有内容

jopen 2015-10-05 4552 0

容器

IDFS", "IveelySE.IDFS\IveelySE.IDFS.csproj", 这是分布式文件系统部分，包括MapReduce的实现都将在此（此版本无效）。 "IveelySE.BigData"

openkk 2012-08-05 65697 0

搜索引擎

这个特殊的特性能够实现分布式功能。利用这个功能，你能建立高效、容错的Solr服务器群。这对于访问量规模巨大的企业级应用来说，使用SolrCloud能实现高有效性、容错性、分布式索引和搜索功能。 1 了解SolrCloud

jopen 2014-03-13 68401 0

Solr 搜索引擎

lab所开源的类Hadoop MapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间

jopen 2014-11-17 109482 0

Spark 分布式/云计算/大数据

大数据和区块链两者之间有个共同的关键词：分布式，代表了一种从技术权威垄断到去中心化的转变。 分布式存储：HDFS vs. 区块大数据，需要应对海量化和快增长的存储，这要求底层硬件架构和文件系统在性价比上要大大高

avalon6884 2017-03-08 40607 0

大数据区块链

P50

Distributed File System，是一个开源的，基于列存储模型的分布式数据库。HDFS分布式文件系统Hivehive是基于hadoop分布式计算平台上的提供data warehouse的sql功能的一套

x32577539 2012-12-10 19742 0

分布式/云计算/大数据 Java PHP C/C++ Go

P9

HBase简介 HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google

fyhbbs 2013-05-30 489 0

分布式/云计算/大数据 SQL

作为按对象/块/文件方式存储的开源分布式文件系统，Ceph程序代码人人皆可得，但想要易于部署与管理，功能、效能、稳定性样样精通，达到企业级的存储系统需求，就要各凭本事了。让我们来看看新兴与传统存储厂商如何以Ceph开创新格局：

jopen 2015-11-18 6406 0

Ceph

server。数据模型 Zookeeper 会维护一个具有层次关系的数据结构，它非常类似于一个标准的文件系统，如图 1 所示： Zookeeper 这种数据结构有如下这些特点：每个子目录项如 NameService

yijindong 2016-02-17 17668 0

分布式/云计算/大数据

Stack）中的位置。可见Spark专注于数据的计算，而数据的存储在生产环境中往往还是由Hadoop分布式文件系统HDFS承担。图1 Spark在BDAS中的位置 Spark被设计成支持多场景的

jopen 2015-02-03 29051 0

Spark 分布式/云计算/大数据

Stack）中的位置。可见Spark专注于数据的计算，而数据的存储在生产环境中往往还是由Hadoop分布式文件系统HDFS承担。图1 Spark在BDAS中的位置 Spark被设计成支持多场景的

jopen 2015-01-29 28746 0

Spark 分布式/云计算/大数据

hadoop搭建与eclipse开发环境设置文档

hadoop搭建与eclipse开发环境设置及远程调试文档

关于大型网站技术演进的思考（十二）--网站静态化处理—缓存（4）经验

十八款Hadoop工具帮你驯服大数据经验

程序员技术练级攻略问答

深入浅出Docker（一）：Docker核心技术预览经验

程序员技术提升必读文档

MapReduce的原理文档

Oberon 操作系统：一个被忽略的珍宝资讯

存储在容器中是如何工作的资讯

C#实现的搜索引擎 - Iveely Search Engine 经验

Solr云(SolrCloud)简介经验

Spark介绍经验

大数据和区块链之间的比较分析经验

HBase 简介 (来自京东商城) 文档

HBase 技术介绍简介 NOSQL数据库入门文档

开源来势汹汹，Ceph 靠什么颠覆传统企业级存储？资讯

Windows安装和使用zookeeper 经验

大数据计算平台Spark内核全面解读经验

Spark 内核研究经验

分布式文件系统的相关搜索

关键词

hadoop搭建与eclipse开发环境设置 文档

hadoop搭建与eclipse开发环境设置及远程调试 文档

关于大型网站技术演进的思考（十二）--网站静态化处理—缓存（4） 经验

十八款Hadoop工具帮你驯服大数据 经验

程序员技术练级攻略 问答

深入浅出Docker（一）：Docker核心技术预览 经验

程序员技术提升必读 文档

MapReduce的原理 文档

Oberon 操作系统：一个被忽略的珍宝 资讯

存储在容器中是如何工作的 资讯

C#实现的搜索引擎 - Iveely Search Engine 经验

Solr云(SolrCloud)简介 经验

Spark介绍 经验

大数据和区块链之间的比较分析 经验

HBase 简介 (来自京东商城) 文档

HBase 技术介绍简介 NOSQL数据库 入门 文档

开源来势汹汹，Ceph 靠什么颠覆传统企业级存储？ 资讯

Windows安装和使用zookeeper 经验

大数据计算平台Spark内核全面解读 经验

Spark 内核研究 经验

分布式文件系统 的相关搜索

关键词

hadoop搭建与eclipse开发环境设置文档

hadoop搭建与eclipse开发环境设置及远程调试文档

关于大型网站技术演进的思考（十二）--网站静态化处理—缓存（4）经验

十八款Hadoop工具帮你驯服大数据经验

程序员技术练级攻略问答

深入浅出Docker（一）：Docker核心技术预览经验

程序员技术提升必读文档

MapReduce的原理文档

Oberon 操作系统：一个被忽略的珍宝资讯

存储在容器中是如何工作的资讯

Solr云(SolrCloud)简介经验

Spark介绍经验

大数据和区块链之间的比较分析经验

HBase 技术介绍简介 NOSQL数据库入门文档

开源来势汹汹，Ceph 靠什么颠覆传统企业级存储？资讯

大数据计算平台Spark内核全面解读经验

Spark 内核研究经验

分布式文件系统的相关搜索