2013年Hadoop实时查询将成现实 资讯

Cloudera 公司的 两个新项目 : Impala 和 Trevni ,将有助在 2013 年实现 Hadoop 实时查询。 Impala 是开源版的 Dremel (Dremel 是 Google 大

jopen 2012-12-09   11617   0
Hadoop  

微博广告推荐中有关Hadoop的那些事 经验

高信息传播速度,就成了重中之重。因此,我们引入了hadoop 分布式计算平台,对用户数据和内容数据进行分析和挖掘,作为广告推荐的基础。 二、问题及解决方案 在hadoop平台上进行开发时,主要遇到了以下一些问题:

d3fw 2015-04-27   14364   0

Hadoop的生命周期有多久? 资讯

Hadoop技术已经无处不在。不管是好是坏,Hadoop已经成为 大数据 的代名词。短短几年间,Hadoop从一种边缘技术成为事实上的标准。看来,不仅现在Hadoop是企业 大数据 的标准,而且在未来,它的地位似乎一时难以动摇。

jopen 2015-01-10   10742   0
Hadoop  

飞起来的大象:Hadoop从离线到在线 资讯

展的同时,企业的需求也不断升级。例如从离线到在线的转变,规模效应的需求,更低的成本需求都刺激着Hadoop生态圈的进步和壮大。 2014业内值得关注的事情 1. Hortonworks上市 H

jopen 2015-07-28   24766   0
Hadoop  

Spring for Apache Hadoop 2.3 M1 发布 资讯

Spring for Apache Hadoop 提供了 Spring 框架用于创建和运行 Hadoop MapReduce、Hive 和 Pig 作业的功能,包括 HDFS 和 HBase。如果你需要简单的基于

jopen 2015-08-05   11452   0
Hadoop  

hadoop 2.7.0版本发布 资讯

(1)从这个版本开始,JDK必须是JDK 7+,JDK 6以及更低版本不再支持; (2)hadoop 2.7.0是测试版本,不能在生产环境中使用。 1. Hadoop Common 支持Windows Azure存储—以blob作为文件系统

jopen 2015-05-04   7353   0
Hadoop  

Hadoop/Spark生态圈里的新气象 资讯

令人惊讶的是,Hadoop在短短一年的时间里被重新定义。让我们看看这个火爆生态圈的所有主要部分,以及它们各自具有的意义。 对于Hadoop你需要了解的最重要的事情就是 ,它不再是原来的Hadoop。

jopen 2016-02-16   35271   0
Hadoop   Spark  
P32

  基于hadoop的数据仓库技术 文档

1. 基于hadoop的数据仓库技术 2. 目录Hadoop简介 HDFS (Hadoop Distributed File System) MapReduce Hive本文的内容主要来自三篇hadoop领域的核心论文

xcxc 2015-08-24   524   0
P49

  文档式数据库在Hadoop集群中的应用 文档

1. 文档式数据库 在Hadoop集群中的应用SequoiaDB – 王涛 2. 提纲大数据回顾1数据库在Hadoop中的定位3用户案例4文档式数据库特性2 3. 大数据回顾Batch Analytics

tony2007 2015-06-19   1856   0

Hadoop分布式文件系统:结构与设计 博客

1. 介绍 Hadoop 分布式文件系统 (HDFS)是一个设计为用在普通硬件设备上的分布式文件系统。它与现有的分布式文件系统有很多近似的地方,但又和这些文件系统有很明显的不同。HDFS 是高容错

Hadoopp 2012-09-28   1325   0
P18

  hadoop搭建与eclipse开发环境设置 文档

hadoop搭建与eclipse开发环境设置     ――罗利辉 1. 前言 1.1 目标 目的很简单,为进行研究与学习,部署一个hadoop运行环境,并搭建一个hadoop开发与测试环境。 具体目标是:

huafenged 2011-08-17   4456   0

Hadoop Distributed System (HDFS) 写入和读取流程 经验

一、HDFS HDFS全称是Hadoop Distributed System。HDFS是为以流的方式存取大文件而设计的。适用于几百MB,GB以及TB,并写一次读多次的场合。而对于低延时数据访问、

fmms 2012-02-21   56900   0

hadoop分布式集群搭建 经验

hadoop版本:hadoop-0.20.205.0-1.i386.rpm 下载地址:http://www.fayea.com/apache-mirror/hadoop/common/hadoop-0

openkk 2012-09-01   32361   0

深入理解Hadoop集群和网络 经验

摘要: 本文将着重于讨论Hadoop集群的体系结构和方法,及它如何涉及到网络和服务器基础设施。开始我们先学习一下Hadoop集群运作的基础。 导读:云计算和Hadoop中网络是讨论得相对比较少的领域。本文

openkk 2012-09-01   19388   0

hadoop 2.0 详细配置教程 经验

PS:文章有部分参考资料来自网上,并经过实践后写出,有什么问题欢迎大家联系我。 Hadoop 2.0集群配置详细教程 前言 Hadoop2.0介绍 Hadoop 是 apache 的开源 项目,开发的主要目的是为了构建可靠,可拓展

jopen 2012-09-18   80115   0

hadoop集群增加/删除节点 经验

hadoop要发到每个节点的配置文件,只有core-site.xml mapred-site.xml hdfs-site.xml 添加节点 1.修改host 和普通的datanode一样。添加namenode的ip

jopen 2012-10-11   26263   0

Hadoop 管理监控工具:Apache Ambari 经验

Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari目前已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 H

jopen 2012-12-25   77765   0

如何在Hadoop 2.0上实现深度学习? 经验

这本身有它 自己的挑战。 下面我们就将一起探讨如何将深度学习(最前沿的机器学习框架)部署到Hadoop的集群中。还将提供如何对算法进行修改以便适应分布式环境。同时还将展示在标准数据集下的运行结果。

jopen 2015-03-11   21678   0

Hadoop的一个Job跟踪器:Timberlake 经验

Timberlake是一个Go服务器搭配React.js作为前端。它改善现有的 Hadoop job 跟踪器,通过提供正在运行和已经完成MapReduce jobs的一个轻量级实时视图。Timberlake

jopen 2014-11-24   11549   0

Hadoop 迭代式计算框架:Guagua 经验

Hadoop 迭代式计算框架 Guagua 是 PayPal 的一个开源机器学习框架 Shifu 的子项目。Guagua 主要解决了模型训练的分布式问题。同时 Guagua 并没有将自己局限在分类模型,Guagua

jopen 2014-07-30   14227   0
1 2 3 4 5 6 7 8 9 10