开源项目,开源代码,开源文档,开源新闻,开源社区

Apache Kudu 简介为了应对先前发现的这些趋势，有两种不同的方式：持续更新现有的Hadoop工具或者重新设计开发一个新的组件。其目标是：对数据扫描(scan)和随机访问(random

jopen 2016-02-27 7222 0

Cloud Dataproc服务Beta测试版。Cloud Dataproc是一个托管的Spark与Hadoop服务，可以帮助用户快速创建集群、简化集群管理及降低使用成本。借助该服务，用户无需考虑部署、扩展

jopen 2015-10-08 8859 0

Hadoop Spark

编者按 Hadoop于2006年1月28日诞生，至今已有10年，它改变了企业对数据的存储、处理和分析的过程，加速了大数据的发展，形成了自己的极其火爆的技术生态圈，并受到非常广泛的应用。在2016年

jopen 2016-01-29 9843 0

Hadoop

Apache Hadoop。如今，Google 正在努力通过Google Cloud Storage Hadoop预览版更简单的在 Google Cloud Platform 上运行Hadoop，这样你就

jopen 2014-01-17 14191 0

Google Hadoop

P12

Hadoop和HBase分布式配置及整合My Eclipse开发 Q:620734263 说明：本文档主要侧重hadoop和hbase在windows下的开发.在linux上开发自行修改即可. 一、

chenkunopq 2012-04-23 225 0

Hadoop 分布式/云计算/大数据

据Marketwatch 报道，英特尔昨天作出了一个震惊整个大数据市场的决定——停止发行英特尔自己的Hadoop版本，转而支持Hadoop发行商Cloudera。消息人士透露英特尔资本还将向Cloudera追加超过

jopen 2014-03-27 8374 0

Hadoop Cloudera

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导入到Hadoop的HDFS中，也可以将HDFS的数据导入到关系型数据库中。

jopen 2014-08-13 13701 0

Apache Sqoop

过去十年中，雅虎在 Apache Hadoop 集群构建和扩展方面投入了很大的精力。目前，雅虎有 19 个 Hadoop 集群，其中包含 4 万多台服务器和超过 600PB 的存储。他们在这些集群上开发了大规模机器学习算法，将

vgtr 2015-10-27 15225 0

Hadoop

(WJW)高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南为了部署HA集群,应该准备以下事情: namenode服务器: 运行namenode的服务器应该有相同的硬件配置

jopen 2015-01-08 56311 0

Hadoop MapReduce 分布式/云计算/大数据

Apache hadoop 项目组最新消息，hadoop3.x以后将会调整方案架构，将Mapreduce 基于内存+io+磁盘，共同处理数据。其实最大改变的是hdfs,hdfs 通过最近bla

zfb1226 2016-06-02 26655 0

Hadoop Spark 分布式/云计算/大数据

供了C++版的MapReduce接口。百度HCE语言的有关内容，HCE是基于C++的Hadoop环境，是一个全功能C++环境，可以避开Java语言对于释放内存和资源申请的弊端，并在调用数据时

openkk 2012-08-25 23315 0

Hadoop 分布式/云计算/大数据

简介 hadoop中的NameNode好比是人的心脏，非常重要，绝对不可以停止工作。在hadoop1时代，只有一个NameNode。如果该NameNode数据丢失或者不能工作，那么整个集群就不

jopen 2014-01-26 107199 0

Hadoop 分布式/云计算/大数据

前些日子，腾讯主导开源大数据平台 Apache Hadoop 2.8.4 新版本发布的新闻引起了笔者的注意。自 Hadoop 从雅虎诞生之日起，已经走过了 10 来个年头，这期间，尤其是近年来，由华人作为

jopen 2018-07-11 15687 0

Hadoop 腾讯

1.hadoop2.6.0版本，提交mapreduce程序 mkdir input cd input echo hello world >> file1 echo hello hadoop >> file2

RosCPG 2016-03-02 20889 0

分布式/云计算/大数据

学家，但数据驱动的决策不会是这样。在未来一年，更简单的大数据发现工具让业务分析员可以寻找企业 Hadoop 集群中的数据集，将它们重新做成新的混搭组合，甚至运用探索性机器学习方法来分析它们。 “大数据”会消亡

jopen 2016-01-05 26776 0

Spark MapReduce

编者按：Hadoop于2006年1月28日诞生，至今已有10年，它改变了企业对数据的存储、处理和分析的过程，加速了大数据的发展，形成了自己的极其火爆的技术生态圈，并受到非常广泛的应用。在2016年Ha

jopen 2016-03-02 33897 0

Hadoop

Apache knox是一个访问hadoop集群的restapi网关，它为所有rest访问提供了一个简单的访问接口点，能完成3A认证（Authentication，Authorization，Auditing）和SSO（单点登录）等。

有容云 2016-08-04 12012 0

Apache Knox Hadoop

原文 http://www.jizhuomi.com/software/455.html Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统，适合部署在廉价

jopen 2015-11-02 19493 0

HDFS

编者按今天是Hadoop十岁生日。于2006年1月28日诞生的它改变了企业对数据的存储、处理和分析的过程，加速了大数据的发展，形成了自己的极其火爆的技术生态圈，并受到非常广泛的应用。InfoQ策

jopen 2016-01-28 56044 0

大数据 Hadoop

网络爬虫架构在Nutch+Hadoop之上，是一个典型的分布式离线批量处理架构，有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取，所以，需要一个分布式搜索引擎，

jopen 2014-09-01 86773 0

Hadoop 网络爬虫 ElasticSearch

Hadoop 存储系统，Apache Kudu 0.7.0 发布资讯

谷歌推出Dataproc，让Spark、Hadoop更便宜更快更简单资讯

Hadoop之父祝贺黄色小象的十岁生日快乐资讯

Google 打造云中 Hadoop 便捷版强势对抗 AWS 资讯

Hadoop和HBase分布式配置及整合My Eclipse开发文档

英特尔放弃发行 Hadoop 版本，转而支持 Cloudera 资讯

Hadoop与关系数据库数据相互迁移工具 Apache Sqoop 1.4.5 发布资讯

雅虎如何在Hadoop集群上实现大规模分布式深度学习资讯

高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南经验

呼之欲出！比Spark快10倍的Hadoop3.0有哪些实用新特性？经验

百度的Hadoop分布式文件系统图解：4000节点集群经验

最详细的hadoop2.2.0集群的HA高可靠的最简单配置经验

Hadoop老矣，为什么腾讯还要花精力在其开源发布上？资讯

测试hadoop集群是否安装成功：网页监控页面和提交job运行经验

2016年大数据领域预测：Spark淘汰MapReduce，拯救Hadoop 资讯

专访王峰：Hadoop生态下一代计算引擎-streaming和batch的统一资讯

Apache Knox v0.9.1发布，一个访问hadoop集群的restapi网关资讯

还不懂Hadoop分布式文件系统HDFS的工作原理？ - 快来扫扫盲吧资讯

大数据技术的回顾与展望 ——写在Hadoop十周年纪念资讯

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎经验

K-means Hadoop 的相关搜索

关键词

Hadoop 存储系统，Apache Kudu 0.7.0 发布 资讯

谷歌推出Dataproc，让Spark、Hadoop更便宜更快更简单 资讯

Hadoop之父祝贺黄色小象的十岁生日快乐 资讯

Google 打造云中 Hadoop 便捷版 强势对抗 AWS 资讯

Hadoop和HBase分布式配置及整合My Eclipse开发 文档

英特尔放弃发行 Hadoop 版本，转而支持 Cloudera 资讯

Hadoop与关系数据库数据相互迁移工具 Apache Sqoop 1.4.5 发布 资讯

雅虎如何在Hadoop集群上实现大规模分布式深度学习 资讯

高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南 经验

呼之欲出！比Spark快10倍的Hadoop3.0有哪些实用新特性？ 经验

百度的Hadoop分布式文件系统图解：4000节点集群 经验

最详细的hadoop2.2.0集群的HA高可靠的最简单配置 经验

Hadoop老矣，为什么腾讯还要花精力在其开源发布上？ 资讯

测试hadoop集群是否安装成功：网页监控页面和提交job运行 经验

2016年大数据领域预测：Spark淘汰MapReduce，拯救Hadoop 资讯

专访王峰：Hadoop生态下一代计算引擎-streaming和batch的统一 资讯

Apache Knox v0.9.1发布，一个访问hadoop集群的restapi网关 资讯

还不懂Hadoop分布式文件系统HDFS的工作原理？ - 快来扫扫盲吧 资讯

大数据技术的回顾与展望 ——写在Hadoop十周年纪念 资讯

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎 经验

K-means Hadoop 的相关搜索

关键词

Hadoop 存储系统，Apache Kudu 0.7.0 发布资讯

谷歌推出Dataproc，让Spark、Hadoop更便宜更快更简单资讯

Hadoop之父祝贺黄色小象的十岁生日快乐资讯

Google 打造云中 Hadoop 便捷版强势对抗 AWS 资讯

Hadoop和HBase分布式配置及整合My Eclipse开发文档

Hadoop与关系数据库数据相互迁移工具 Apache Sqoop 1.4.5 发布资讯

雅虎如何在Hadoop集群上实现大规模分布式深度学习资讯

高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南经验

呼之欲出！比Spark快10倍的Hadoop3.0有哪些实用新特性？经验

百度的Hadoop分布式文件系统图解：4000节点集群经验

最详细的hadoop2.2.0集群的HA高可靠的最简单配置经验

Hadoop老矣，为什么腾讯还要花精力在其开源发布上？资讯

测试hadoop集群是否安装成功：网页监控页面和提交job运行经验

专访王峰：Hadoop生态下一代计算引擎-streaming和batch的统一资讯

Apache Knox v0.9.1发布，一个访问hadoop集群的restapi网关资讯

还不懂Hadoop分布式文件系统HDFS的工作原理？ - 快来扫扫盲吧资讯

大数据技术的回顾与展望 ——写在Hadoop十周年纪念资讯

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎经验