细细品味大数据--初识hadoop 经验

com/BaiYiShaoNian/p/4769178.html 初识hadoop 前言 之前在学校的时候一直就想学习大数据方面的技术,包括hadoop和机器学习啊什么的,但是归根结底就是因为自己太懒了,导致没有坚持多长时间,

jopen 2015-08-30   15444   0

Hadoop - Ambari集群管理剖析 经验

1.Overview Ambari是Apache推出的一个集中管理Hadoop的集群的一个平台,可以快速帮助搭建Hadoop及相关以来组件的平台,管理集群方便。这篇博客记录Ambari的相关问题和

jopen 2015-12-25   256529   0

elasticsearch-hadoop使用示例 经验

在elasticsearch-hadoop的具体使用中碰到了几个问题,有必要记录一下,避免下次遇到时又要重新研究。 利用spark读取es数据源的简单示例 import org.elasticsearch

jopen 2016-01-07   22370   0

hadoop2.6.3 集群部署 经验

net/chinagissoft/article/details/50481194 准备工作 准备三台ubuntu1404 环境 master  192.168.12.127 slave1  192.168

StevenGrey 2016-01-27   21394   0
P23

  Hadoop 源代码分析(MapReduce概论) 文档

2009-02-21 Hadoop源代码分析(MapReduce概论) 大家都熟悉文件系统,在对HDFS进行分析前,我们并没有花很多的时间去介绍HDFS的背景,毕竟大家对文件系统的还是有一定的理解的

gps2012 2013-01-14   247   0
P5

  hadoop集群配置范例 文档

HADOOP-0.20.2分布式集群配置 本文以安装和使用hadoop-0.20.2为例。 硬件环境 1. 虚拟机VMWare Workstation 6.5.2build 2. 三台机器均安装redhat

tony2007 2015-06-20   260   0

Hadoop平台集群搭建 经验

1. Linux配置hadoop环境 环境:Ubuntu10 linux、 jdk-7-linux-i586.tar.gz 1.1 将jdk上传到Ubuntu a. 在虚拟机中设置->选项->共享文件夹

jopen 2014-03-19   12260   0

hadoop 网站日志分析 经验

org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import

jopen 2014-03-26   19031   0

Hadoop开发使用备记 经验

使用Hadoop已经有一段时间了,从开始的迷茫,到各种的尝试,到现在组合应用….慢慢地涉及到数据处理的事情,已经离不开hadoop了。Hadoop在大数据领域的成功,更引发了它本身的加速发展。现在Ha

jopen 2014-05-20   52523   0

基于Hadoop的实时查询:Cloudera Impala 经验

Cloudera 发布实时查询开源项目 Impala (黑斑羚)!多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝。

jopen 2012-10-24   35447   0

Hadoop作业调度管理系统 - Corona 经验

Corona,这是 Facebook 用来调度和管理大规模 Hadoop 作业的系统。 Corona 是 Map-Reduce 的改进版本,可以更好地利用集群资源,更适合 Facebook 的“多

jopen 2012-11-09   17046   0

Hadoop 实现多文件输出 经验

要求按单词的首字母区分单词并分文件输出 代码如下: LineRecordWriter package com.hadoop.multi; import java.io.DataOutputStream; import

jopen 2013-07-11   25859   0

hadoop分布式部署 经验

配置如下: hadoop1.example.com:192.168.2.1(NameNode) hadoop2.example.com:192.168.2.2(DataNode) hadoop3.example

jopen 2014-07-15   22927   0

Hadoop MapReduceV2(Yarn) 框架 经验

Hadoop MapReduceV2(Yarn) 框架简介 原 Hadoop MapReduce 框架的问题 对于业界的大数据存储及分布式处理系统来说,Hadoop 是耳熟能详的卓越开源分布式文件存储及处理框架,对于

jopen 2014-09-11   22474   0

利用 Spring Boot 在 Docker 中运行 Hadoop 经验

过程。本文介绍了如何利用Spring Boot在Docker中运行Hadoop任务。 简介 越来越多的应用都开始使用Hadoop框架。而开发者在使用过程中也遇到一些挑战,比如使用诸如Docker之

jopen 2015-05-09   53777   0
Docker  
P4

  告诉你hadoop是什么 文档

【图解】告诉你Hadoop是什么         Hadoop是一种分析和处理大数据的软件平台,是Appach的一个用Java语言所实现的开源软件的加框,在大量计算机组成的集群当中实现了对于海量的数据进行的分布式计算。

wyc08st 2016-04-30   602   0
P12

  Hadoop 0.20.0 源码流程分析 文档

Hadoop源码以及流程解析 整体结构 DN: Configuration,JobClient,JobConf Master:JobTracker,JobInProgress,TaskInProgress

sweetbaybe 2012-12-24   2501   0
P11

  Hadoop 源码阅读总结 文档

还是分布策略 可能出现一个DN上两个相同的Block么. MapReduce 命令行运行 bin/hadoop jar jarFile [mainClass] args... 设置JVM启动参数,将lib

bluesky666 2015-05-05   1964   0
P27

  Hadoop HDFS 实现原理与应用介绍 文档

百度系统部HDFS实现原理与应用介绍lixiangna@baidu.com 2. 主要内容应用背景 Hadoop简介 HDFS设计目标 HDFS系统结构 HDFS实现原理 典型实例 3. 应用背景需求 每天上TB的日志需要存储备份

cablist 2012-11-12   13153   0
P31

  内存计算Spark和 SQL on Hadoop 文档

内存计算Spark和 SQL on Hadoop 黄永卿 解决方案中心 2. 目录1内存计算Spark介绍2Spark核心要点3SQL on Hadoop技术比较43+1大数据分析方案介绍 3. 安装配置与简介为什么需

pnx8 2014-08-17   756   0
1 2 3 4 5 6 7 8 9 10