使用 Azure、Hadoop 和 Mahout 构建一个推荐系统 经验

从Stack Exchange数据集中提取所需的信息 用提取的信息建立一个推荐 但是,一切从基础开始!如果你是第一次接触Apache Hadoop和Azure上的Hadoop, 我建议你在开始之前阅读这些介绍性的文章

jopen 2013-07-17   33383   0
Hadoop   Mahout  

淘宝Hadoop作业平台:宙斯Zeus 经验

宙斯(zeus)是什么 宙斯是一个完整的Hadoop的作业平台 从Hadoop任务的调试运行到生产任务的周期调度 宙斯支持任务的整个生命周期 从功能上来说,支持: Hadoop MapReduce任务的调试运行

jopen 2013-05-03   48614   0

Hadoop环境搭建过程中可能遇到的问题 经验

lusterID不一致,导致集群启动时,hadoop会杀死从节点的datanode进程。 解决方案: a) 将集群关闭; b) 删除你在hadoop配置中设置的tmp下的data和name中的内容(每一个节点都要做这个操作)

jopen 2015-06-08   11851   0

hadoop2.6.0 在64位CentOS 6.4系统上的编译 经验

直接使用官网上下载的hadoop2.6.0在运行时候经常都会遇到WARN util.NativeCodeLoader: Unable to load native-hadoop library for

jopen 2015-12-31   8186   0

hadoop集群ambari搭建(1)之ambari-server安装 经验

Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari目前已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、

jopen 2016-01-18   60642   0

VMware发布Serengeti项目,支持云中部署Hadoop 资讯

虚拟和云环境中快速部署、管理和扩展Apache Hadoop。此外,VMware与Apache Hadoop社区共同合作研发扩展功能,让主要组件可以“感知虚拟化”以支持灵活扩展,并进一步提高Hadoop在虚拟化环境中的性能。

openkk 2012-06-15   17172   1
Hadoop  

在生产环境中使用 Hadoop, HBase 和 Hive 的英文视频 资讯

本讲座讨论了Hadoop的HBase和Hive在现实世界中的生产用例。每个系统的特点,解释他们如何可以一起使用,以及建立大规模数据基础设施的实时应用程序和数据仓库之间的糊模界线。

jopen 2012-09-25   18864   0
Hadoop   HBase   Hive  

Hadoop供应商Hortonworks获得1亿美金D轮融资 资讯

据 Gigaom 消息 ,Hadoop 软件供应商 Hortonworks 获得 1 亿美金 D 轮融资,由黑石领投,雅虎、Benchmark 等参投。目前 Hortonworks 的总融资已达到 1

jopen 2014-03-26   7994   0
Hadoop  

一篇文看懂Hadoop:风雨十年,未来何去何从 资讯

我们很荣幸能够见证Hadoop十年从无到有,再到称王。感动于技术的日新月异时,希望通过这篇内容深入解读Hadoop的昨天、今天和明天,憧憬下一个十年。 本文分为技术篇、产业篇、应用篇、展望篇四部分

jopen 2016-03-10   25303   1
Hadoop  
P3

  Hadoop 关于处理大量小文件的问题和解决方法 文档

Hadoop关于处理大量小文件的问题和解决方法 2011年9月8日 12:42   小文件指的是那些size比HDFS的block size(默认64M)小的多的文件。如果在HDFS中存储小文件,那

wtwt 2013-03-20   409   0
P30

  Apache Tez - 下一代Hadoop上的执行引擎 文档

1Apache Tez : Next Generation Execution Engine upon Hadoop Jeff Zhang 2. OutlineTez Introduction Tez API Tez

byc2 2014-11-18   348   0

Hadoop目前使用情况的调查和采访 资讯

英文原文: A Survey and Interview on How Hadoop Is Used Today 我们正生活在“大数据”的时代。在当今这个技术驱动的世界,计算能力、电子设备和 Internet

jopen 2013-12-19   14151   0
Hadoop  

Hadoop工具在其不断进化中披荆斩棘 资讯

当提到大数据管理,Hadoop绝对是业界最受欢迎的。随着它日益增长的普及性,云管理员不得不应付其不断升级的生态系统的挑战。Hadoop最开始是一 个用来运行MapReduce的平台,但却渐渐演化成为一

jopen 2014-12-17   9930   0
Hadoop  

Hadoop作为云托管服务的优劣势分析 资讯

htm 云端Hadoop又叫Hadoop即服务(HaaS),这是平台即服务(PaaS)的一个子类。 Apache Hadoop是一种开源软件框架,能够对分布式集群上的大数据集进行高吞吐量处理。Apache模块包括Hadoop

jopen 2015-07-08   17533   0
Hadoop  

15种最佳方式帮你顺利掌握Hadoop技术 资讯

在探讨今天的主题——如何利用各类资源学习Hadoop知识——之前,让我们首先搞清楚另一个问题:大数据Hadoop到底是什么?简单来 讲,Hadoop是一套用于实现大数据技术的框架方案。为了顺利掌握Hadoop,大家需要理解两

jopen 2015-08-12   11542   0
Hadoop  

Hadoop年度回顾与2016发展趋势 资讯

com/569 董西成,Hulu 网,专注于分布式计算和资源管理系统等相关技术。《Hadoop 技术内幕:深入解析 MapReduce 架构设计与实现原理》和《Hadoop 技术内幕:深入解 析 YARN 架

码头工人 2015-12-30   20231   0
Hadoop  

别再比较Hadoop和Spark了,那不是设计人员的初衷 资讯

Hadoop与Spark孰优孰劣这个问题,最准确的观点就是,设计人员旨在让Hadoop和Spark在同一个团队里面协同运行。 直接比较Hadoop和Spark有难度,因为它们处理的许多任务都一样,但是在一些方面又并不相互重叠。

jopen 2016-03-09   8767   0
Spark   Hadoop  

开发基于VMware虚拟平台的Hadoop应用 Serengeti 经验

Serengeti,支持企业能够在虚拟和云环境中快速部署、管理和扩展Apache Hadoop。用于在虚拟平台上快速开发一个Apache Hadoop集群(HDFS, MapReduce, Pig, Hive, ..)。

openkk 2012-06-15   19326   0

Hadoop集群环境下网络架构的设计与优化 经验

数据时代,研究大数据的IT 厂商把研究重心放在优化大数据系统软件架构、优化业务逻辑、优化数据分析算法、优化节点性能等方向,而忽略了大数据环境基础设置中网络环节的评估和优化。本文介绍了思科公司在Hadoop

jopen 2014-04-15   11532   0

小米研发的hadoop布署、监控系统:Minos 经验

Minos是小米hadoop团队自主研发的hadoop布署、监控系统。它起初被开发和用于部署与管理小米公司中的Hadoop, HBase 和 ZooKeeper集群。Minos可以很容易地扩展,以支持其他系统包括:HDFS

jopen 2013-09-15   59382   0
1 2 3 4 5 6 7 8 9 10