P18

  hadoop搭建与eclipse开发环境设置 文档

hadoop搭建与eclipse开发环境设置     ――罗利辉 1. 前言 1.1 目标 目的很简单,为进行研究与学习,部署一个hadoop运行环境,并搭建一个hadoop开发与测试环境。 具体目标是:

huafenged 2011-08-17   4456   0

Hadoop Distributed System (HDFS) 写入和读取流程 经验

HDFS全称是Hadoop Distributed System。HDFS是为以流的方式存取大文件而设计的。适用于几百MB,GB以及TB,并写一次读多次的场合。而对于低延时数据访问、大量小文件、同

fmms 2012-02-21   56900   0

hadoop分布式集群搭建 经验

hadoop版本:hadoop-0.20.205.0-1.i386.rpm 下载地址:http://www.fayea.com/apache-mirror/hadoop/common/hadoop-0

openkk 2012-09-01   32361   0

深入理解Hadoop集群和网络 经验

摘要: 本文将着重于讨论Hadoop集群的体系结构和方法,及它如何涉及到网络和服务器基础设施。开始我们先学习一下Hadoop集群运作的基础。 导读:云计算和Hadoop中网络是讨论得相对比较少的领域。本文

openkk 2012-09-01   19388   0

hadoop 2.0 详细配置教程 经验

PS:文章有部分参考资料来自网上,并经过实践后写出,有什么问题欢迎大家联系我。 Hadoop 2.0集群配置详细教程 前言 Hadoop2.0介绍 Hadoop 是 apache 的开源 项目,开发的主要目的是为了构建可靠,可拓展

jopen 2012-09-18   80115   0

hadoop集群增加/删除节点 经验

hadoop要发到每个节点的配置文件,只有core-site.xml mapred-site.xml hdfs-site.xml 添加节点 1.修改host 和普通的datanode一样。添加namenode的ip

jopen 2012-10-11   26263   0

Hadoop 管理监控工具:Apache Ambari 经验

Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari目前已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 H

jopen 2012-12-25   77765   0

Hadoop集群上运行R程序--安装RHadoop 经验

RHadoop是由Revolution Analytics发起的一个开源项目,它可以将统计语言R与Hadoop结合起来。目前该项目包括三个R packages,分别为支持用R来编写MapReduce应用的

jopen 2013-01-06   14531   0

如何在Hadoop 2.0上实现深度学习? 经验

位于波士顿的数据科学团队正在利用前沿的工具和算法,通过对用户数据的分析来优化业务行为。 数据科学很大程度上依赖机器算法,它能帮助我们发现数据的特征。要想洞察互联网般规模的数据还是很有挑战的,因此能够大规模的运行算法成为了我们的关键需

jopen 2015-03-11   21678   0

Hadoop的一个Job跟踪器:Timberlake 经验

Timberlake是一个Go服务器搭配React.js作为前端。它改善现有的 Hadoop job 跟踪器,通过提供正在运行和已经完成MapReduce jobs的一个轻量级实时视图。Timberlake

jopen 2014-11-24   11549   0

Hadoop 迭代式计算框架:Guagua 经验

Hadoop 迭代式计算框架 Guagua 是 PayPal 的一个开源机器学习框架 Shifu 的子项目。Guagua 主要解决了模型训练的分布式问题。同时 Guagua 并没有将自己局限在分类模型,Guagua

jopen 2014-07-30   14227   0

Hadoop log4j日志说明 经验

system properties hadoop.root.logger=INFO,console hadoop.log.dir=. hadoop.log.file=hadoop.log # # Job Summary

jopen 2013-12-27   53598   0

腾讯TDW:大型Hadoop集群应用 经验

Data Warehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。

jopen 2015-07-28   19632   0

hadoop2.7完全分布式安装 经验

3、/etc/profile HADOOP_PREFIX=/opt/hadoop JAVA_HOME=/opt/jdk1.7 PATH=$PATH:$JAVA_HOME/bin:$HADOOP_PREFIX/

mxw8 2015-06-21   34384   0

hadoop2.7.1环境搭建 经验

在老板的支持下,陆续划拉到了10几台机器,绑定了固定IP,工作之余开始了Hadoop之旅。将要点记录下来,以备查阅。 硬件构成: Resource Volume CPU 2 cores

jopen 2015-12-29   9501   0

Hadoop 2.6 + Hive 1.2.1 + spark-1.4.1(3) 经验

分桶便于有用数据加载到 有限的 内存中 (性能上的优化 ---- 还有 join,group by,distinct ) row format delimited    -- 指定分隔符解析数据 fields

jopen 2015-12-29   9440   0

CG_Hadoop:基于MapReduce的计算几何 经验

摘要: Hadoop使用了MapReduce编程范式,目前已经被公认为是分布 式环境中分析大数据的标准框架。然而,它并不能很好的应用于大规模的计算几何处理。本文介绍的CG_Hadoop是一套可伸缩的和高效的

jopen 2016-01-05   23913   0

如何让Hadoop支持优先级且性能可预测 经验

Apache Hadoop近十年的成长证明,用开源技术处理与访问海量数据并不是什么炒作。然而,Hadoop的一个缺点是不可预测性。Hadoop不能确保企业的关键任务按时完成,也不能完全发挥集群的性能。

LukeOlivare 2016-06-17   11606   0

hadoop再次集群搭建(1)-安装系统 经验

从8月份到现在12月份,中间有四个月的时间没有学习hadoop系统了。其实适应新的环境,到现在一切尘埃落定,就应该静下心来,好好学习一下hadoop以及我之前很想学习的mahout。个人对算法比较感兴

jopen 2016-01-18   8681   0

RedHat开源其Hadoop存储系统 资讯

作为大数据+混合云业务战略的一部分,Red Hat 没有选择推出自己的 hadoop 商业版本或者收购一家 Hadoop 发行厂商,而是推出了首个 Hadoop HDFS 文件存储系统的开源替代产品。

jopen 2013-02-22   8798   0
Hadoop  
1 2 3 4 5 6 7 8 9 10