Apache Hive v2.1.0-rc0 发布

Hive是一个基于Hadoop的开源数据仓库,用于存储和处理海量结构化数据。
jopen 5年前    7956   

Apache Hive v2.0.1发布

Hive是一个基于Hadoop的开源数据仓库,用于存储和处理海量结构化数据。
jopen 5年前    14852   

一篇文看懂Hadoop:风雨十年,未来何去何从

我们很荣幸能够见证Hadoop十年从无到有,再到称王。感动于技术的日新月异时,希望通过这篇内容深入解读Hadoop的昨天、今天和明天,憧憬下一个十年。
jopen 6年前    25303   

指点迷津的现代数据数据架构之道

鉴于许多企业组织在竭力采用易于使用的数据分析技术让大数据广泛可用,它们应考虑将部分功能外包到云端。如果选择一种大数据即服务解决方案,可以处理像Hadoop、Spark和Hive等这些大数据技术很...
jopen 6年前    4973   

别再比较Hadoop和Spark了,那不是设计人员的初衷

对Hadoop与Spark孰优孰劣这个问题,最准确的观点就是,设计人员旨在让Hadoop和Spark在同一个团队里面协同运行。
jopen 6年前    8767   

专访王峰:Hadoop生态下一代计算引擎-streaming和batch的统一

编者按:Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在2016...
jopen 6年前    33897   

MapReduce朝不保夕的江湖地位

可怜的MapReduce,直到2013年末,都是Hadoop系统中的关键一环,在这个开源大数据处理框架中,它既是集群的资源管理器,又作为主要编程手段和处理环境存在。但如今看来,情况正在发生变化。
jopen 6年前    11693   

在Docker上使用Weave搭建Hadoop和Spark跨主机容器集群

实际环境是开发使用的两台服务器,每个服务器上是三个集群容器节点,总共六个节点,使用weave实现跨主机的通信,并且利用小插件可以实现在局域网或者是在外网查看监控集群的webUI和开放7077等关...
jopen 6年前    36540   

Hadoop/Spark生态圈里的新气象

令人惊讶的是,Hadoop在短短一年的时间里被重新定义。让我们看看这个火爆生态圈的所有主要部分,以及它们各自具有的意义。
jopen 6年前    35271   

大数据生态圈与IBM Platform Symphony架构设计

随着开源社区不断的壮大,很多以前鲜为人知的技术慢慢地走进了大众IT人员的视野。对一个数据中心而言,最火的两个技术领域便是云计算与大数据。其中每个领域都有一些代表的项目,如云计算领域的OpenSt...
jopen 6年前    32484   

Hadoop十岁!Doug Cutting成长史+他眼中大数据技术的未来

上次见到(膜拜)Hadoop之父Doug Cutting是在 2年前 ,2014中国大数据技术大会上。今年Hadoop10岁,刚看到他的 Hadoop十周年贺词 ,感觉时间飞逝。最近CSDN和I...
jopen 6年前    25367   

7种常见的hadoop和spark项目

如果您的Hadoop项目将有新的突破,那么它必定与下边介绍的七种常见项目很相像。
jopen 6年前    10075   

Hadoop之父祝贺黄色小象的十岁生日快乐

Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在2016年Had...
jopen 6年前    9843   

大数据技术的回顾与展望 ——写在Hadoop十周年纪念

今天是Hadoop十岁生日。于2006年1月28日诞生的它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。InfoQ策划了一...
jopen 6年前    56044   

2分钟读懂Hadoop和Spark的异同

谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。
jopen 6年前    13152   

年度最佳硬件、软件、开发工具和云服务

知名IT杂志《InfoWorld》的一群编辑和评论人员选出了2015年年度最佳硬件、软件、开发工具和云服务。
jopen 6年前    63864   

Hadoop年度回顾与2016发展趋势

董西成,Hulu 网,专注于分布式计算和资源管理系统等相关技术。《Hadoop 技术内幕:深入解析 MapReduce 架构设计与实现原理》和《Hadoop 技术内幕:深入解 析 YARN 架构...
码头工人 6年前    20231   

如何让Hadoop结合R语言做统计和大数据分析?

R是GNU的一个开源工具,具有S语言血统,擅长 统计 计算和 统计 制图。由Revolution Analytics发起的一个开源项目RHadoop将R语言与Hadoop结合在一起,很好发挥了R...
jopen 6年前    48265   

解析Spark大数据分析框架的核心部件

Spark大数据分析框架的核心部件包含RDD内存数据结构、Streaming流计算框架、GraphX图计算与网状数据挖掘、MLlib机器学习支持框架、Spark SQL数据检索语言、Tachyo...
勿忘初心321 6年前    18139   

如何运用Spark进行实时数据分析

Apache Hadoop是一个成熟的开发框架,其连接着庞大的生态系统,并且得到了Cloudera、Hortonwork、Yahoo这些卓越机构的支持与贡献,并且为各个组织提供了许多工具来管理不...
勿忘初心321 6年前    32298   
1 2 3 4 5 6 7

热门问答

热门文档