开源项目,开源代码,开源文档,开源新闻,开源社区

，但数据驱动的决策不会是这样。在未来一年，更简单的大数据发现工具让业务分析员可以寻找企业 Hadoop 集群中的数据集，将它们重新做成新的混搭组合，甚至运用探索性机器学习方法来分析它们。 “大数据”会消亡

jopen 2016-01-05 26776 0

Spark MapReduce

编者按：Hadoop于2006年1月28日诞生，至今已有10年，它改变了企业对数据的存储、处理和分析的过程，加速了大数据的发展，形成了自己的极其火爆的技术生态圈，并受到非常广泛的应用。在2016年Ha

jopen 2016-03-02 33897 0

Hadoop

原文 http://www.jizhuomi.com/software/455.html Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统，适合部署在廉价

jopen 2015-11-02 19493 0

HDFS

编者按今天是Hadoop十岁生日。于2006年1月28日诞生的它改变了企业对数据的存储、处理和分析的过程，加速了大数据的发展，形成了自己的极其火爆的技术生态圈，并受到非常广泛的应用。InfoQ策

jopen 2016-01-28 56044 0

大数据 Hadoop

网络爬虫架构在Nutch+Hadoop之上，是一个典型的分布式离线批量处理架构，有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取，所以，需要一个分布式搜索引擎，

jopen 2014-09-01 86773 0

Hadoop 网络爬虫 ElasticSearch

你可能听说过 Apache Tez ，它是一个针对 Hadoop 数据处理应用程序的新分布式执行框架。但是它到底是什么呢？它的工作原理是什么？哪些人应该使用它，为什么？如果你有这些疑问，那么可以看一下

jopen 2014-10-13 30952 0

分布式/云计算/大数据 Apache Tez

P6

大数据架构师基础：hadoop家族，Cloudera产品系列等各种技术 2014-07-16 13:51 大数据我们都知道hadoop，可是还会各种各样的技术进入我们的视野：Spark，Storm

tony2007 2015-06-19 2795 0

Hadoop 分布式/云计算/大数据

容器和微服务凭借构架上的灵活优势，已经杀进了Hadoop生态系统。分别位于德国和美国两家公司的技术高管对此提出了自己的观点。最近关于大数据的实践多是基于裸机的，这意味着Hadoop已经在非虚拟服务器上被广为实现

jsho1213 2016-11-10 11218 0

微服务 Hadoop

作，也会被路由到某个节点上面去读取。在最近的一次测试中， Netflix建立了一个288个节点的集群。 2. Lucene/Solr Lucene 是 Apache软件基金会4 jak

jopen 2012-10-18 37422 0

NOSQL

Fig：是一个基于Docker的用于快速搭建开发环境的工具，目前Fig团队已经加入Docker公司。 Kubernets：来自Google的容器集群管理工具，支持跨平台。目前已经得到微软，IBM，红帽，CoreOS等公司的支持。

jopen 2016-01-17 22611 0

Docker Java开发

P158

partition的number该是多少？如果是hdfs文件，那么hdfs文件的block将会成为一个重要的计算依据。集群管理(cluster management) task运行在cluster之上，除了spark自身

bxingqing 2017-06-12 1332 0

分布式/云计算/大数据

P6

环境：三台虚拟机，系统是CentOS6.5 1.关闭防火墙，配置hosts，添加集群中主机和IP的映射关系 ? 1 2 3 4 5 6 [root@hadoop4 ~]$ cat /etc/hosts 127.0.0.1

wudawen 2015-09-10 1639 0

分布式/云计算/大数据

环境：三台虚拟机，系统是CentOS6.5 1.关闭防火墙，配置hosts，添加集群中主机和IP的映射关系 [grid@hadoop4 ~]$ cat /etc/hosts 127.0.0.1 localhost

xg48 2015-04-12 41139 0

Storm 分布式/云计算/大数据

分解。 3. 多维度的可用 1) 负载均衡、容灾、备份随着平台并发量的增大，需要扩容节点进行集群，利用负载均衡设备进行请求的分发；负载均衡设备通常在提供负载均衡的同时，也提供失效检测功能；同时

yne7 2015-03-30 82411 0

架构软件架构

分解。 3. 多维度的可用 1) 负载均衡、容灾、备份随着平台并发量的增大，需要扩容节点进行集群，利用负载均衡设备进行请求的分发；负载均衡设备通常在提供负载均衡的同时，也提供失效检测功能；同时

jopen 2015-11-15 65006 0

架构软件架构

P36

多维度的可用 1) 负载均衡、容灾、备份随着平台并发量的增大，需要扩容节点进行集群，利用负载均衡设备进行请求的分发；负载均衡设备通常在提供负载均衡的同时，也提供失效检测功能；同时为

gwpking 2016-04-15 835 0

电子商务/商城

分解。 3. 多维度的可用 1) 负载均衡、容灾、备份随着平台并发量的增大，需要扩容节点进行集群，利用负载均衡设备进行请求的分发；负载均衡设备通常在提供负载均衡的同时，也提供失效检测功能；同时

dwd4 2015-03-31 73469 0

架构软件架构

edu/ Spark上的SQL执行引擎 Pig http://pig.apache.org/ 基于Hadoop MapReduce的脚本语言 Cloudera Impala http://www.cloudera

dgy7 2015-05-21 56121 0

开源分布式/云计算/大数据

cker集群管理平台，第一个提出并实现了Pod，Replication，Services Discovery等概念。关于技术细节，笔者在此不做过多介绍，请自行百度，Google，或者自己搭建平台体验。下面的其他方案也相同。

jopen 2016-03-04 13808 0

Docker 虚拟化

P50

可扩展性较差：由于增加机器需要给机器分配DHT(分布式hash table)算法所需的编号，操作复杂度较高，且每台机器存储了整个集群的机器信息及数据文件的Merkle Tree信息，机器最大规模只能到几千台。六、几种主流NoSQL数据库——Dynamo

wei5445 2012-03-21 748 0

NoSQL数据库方案 Apache C/C++ Go

2016年大数据领域预测：Spark淘汰MapReduce，拯救Hadoop 资讯

专访王峰：Hadoop生态下一代计算引擎-streaming和batch的统一资讯

还不懂Hadoop分布式文件系统HDFS的工作原理？ - 快来扫扫盲吧资讯

大数据技术的回顾与展望 ——写在Hadoop十周年纪念资讯

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎经验

针对Hadoop数据处理应用程序的新分布式执行框架： Apache Tez 经验

大数据架构师基础：hadoop家族，Cloudera产品系列等各种技术文档

容器和微服务在Hadoop生态系统中找到一席之地经验

值得尝试的10款出色NoSQL数据库资讯

Docker应用场景经验

apache-spark源码走读文档

Storm0.9.5 安装笔记文档

Storm0.9.4安装经验

构建高并发高可用的电商平台架构大纲经验

构建高并发高可用的电商平台架构大纲经验

构建高并发高可用的电商平台架构实践文档

构建高并发高可用的电商平台架构大纲经验

开源大数据利器汇总经验

一个虚拟化老兵的Docker浅见-2 资讯

NoSQL 综述文档

Hadoop2_5_2 HA高可靠性集群搭建(Hadoop Zookeeper) 的相关搜索

关键词

2016年大数据领域预测：Spark淘汰MapReduce，拯救Hadoop 资讯

专访王峰：Hadoop生态下一代计算引擎-streaming和batch的统一 资讯

还不懂Hadoop分布式文件系统HDFS的工作原理？ - 快来扫扫盲吧 资讯

大数据技术的回顾与展望 ——写在Hadoop十周年纪念 资讯

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎 经验

针对Hadoop数据处理应用程序的新分布式执行框架： Apache Tez 经验

大数据架构师基础：hadoop家族，Cloudera产品系列等各种技术 文档

容器和微服务在Hadoop生态系统中找到一席之地 经验

值得尝试的10款出色NoSQL数据库 资讯

Docker应用场景 经验

apache-spark源码走读 文档

Storm0.9.5 安装笔记 文档

Storm0.9.4安装 经验

构建高并发高可用的电商平台架构大纲 经验

构建高并发高可用的电商平台架构大纲 经验

构建高并发高可用的电商平台架构实践 文档

构建高并发高可用的电商平台架构大纲 经验

开源大数据利器汇总 经验

一个虚拟化老兵的Docker浅见-2 资讯

NoSQL 综述 文档

Hadoop2_5_2 HA高可靠性集群搭建(Hadoop Zookeeper) 的相关搜索

关键词

专访王峰：Hadoop生态下一代计算引擎-streaming和batch的统一资讯

还不懂Hadoop分布式文件系统HDFS的工作原理？ - 快来扫扫盲吧资讯

大数据技术的回顾与展望 ——写在Hadoop十周年纪念资讯

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎经验

大数据架构师基础：hadoop家族，Cloudera产品系列等各种技术文档

容器和微服务在Hadoop生态系统中找到一席之地经验

值得尝试的10款出色NoSQL数据库资讯

Docker应用场景经验

apache-spark源码走读文档

Storm0.9.5 安装笔记文档

Storm0.9.4安装经验

构建高并发高可用的电商平台架构大纲经验

构建高并发高可用的电商平台架构大纲经验

构建高并发高可用的电商平台架构实践文档

构建高并发高可用的电商平台架构大纲经验

开源大数据利器汇总经验

NoSQL 综述文档