解析Spark大数据分析框架的核心部件

Spark大数据分析框架的核心部件包含RDD内存数据结构、Streaming流计算框架、GraphX图计算与网状数据挖掘、MLlib机器学习支持框架、Spark SQL数据检索语言、Tachyo...
勿忘初心321 8年前    18139   

如何运用Spark进行实时数据分析

Apache Hadoop是一个成熟的开发框架,其连接着庞大的生态系统,并且得到了Cloudera、Hortonwork、Yahoo这些卓越机构的支持与贡献,并且为各个组织提供了许多工具来管理不...
勿忘初心321 8年前    32298   

还不懂Hadoop分布式文件系统HDFS的工作原理? - 快来扫扫盲吧

Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价 的机器上。它能提供高吞吐量的数据访问,非常适合大规模...
jopen 8年前    19493   
HDFS  

EMC存储上的大数据–HDFS存储可靠性

企业为了从其 Hadoop 分析投资中获取最大价值,企业需要富有弹性的大数据存储基础架构。在传统 Hadoop 集群中,用户必须依赖于自定义的子数据块 CRC 校验和来提供硬件层数据保护,并且在...
jopen 9年前    9330   
HDFS  

热门问答

热门文档