开源项目,开源代码,开源文档,开源新闻,开源社区

本文是关于Flume成功应用Kafka的研究案例，深入剖析它是如何将RDBMS实时数据流导入到HDFS的Hive表中。对于那些想要把数据快速摄取到Hadoop中的企业来讲，Kafka是一个很好的选择。Kafka是什么？

LynHolcomb 2016-08-30 31986 0

数据库 Hadoop 分布式/云计算/大数据 Apache Kafka

P23

1. 分布式运算平台-Hadoop-基础篇马云龙 2. 1：大规模数据处理的问题 2：Hadoop的由来 3：Hadoop需要解决的问题 4：Hadoop介绍 5：HDFS介绍 6：MapReduce介绍

zhpboy 2013-10-12 3298 0

Hadoop 分布式/云计算/大数据 Apache C/C++ Go

P22

li270606338 2013-08-28 7576 0

Hadoop 分布式/云计算/大数据 Go

P15

CentOS6.2下Hadoop全分布式集群配置文档文档更新记录编写人日期版本号变更内容审核人田文武 2012/07/27 V1.0 新建集群网络环境介绍集群包含三个hadoop节点：1个n

wuguai 2012-09-19 5452 0

Hadoop 分布式/云计算/大数据

P12

Hadoop开发环境搭建（Win8+Linux）常见的Hadoop开发环境架构有以下三种： 1、 Eclipse与Hadoop集群在同一台Windows机器上。 2、 Eclipse与Hadoop集群在同一台Linux机器上。

pdddy 2013-09-23 8604 0

Hadoop 分布式/云计算/大数据

Hadoop 简介：一个分布式系统基础架构，由 Apache 基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统（Hadoop

openkk 2012-02-15 57210 0

Hadoop 分布式/云计算/大数据

1、集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统（HDFS，Hadoop Distributed F

jopen 2013-10-24 69931 0

Hadoop 分布式/云计算/大数据

流处理”之中，实时处理消息并更新数据库。这是管理队列及工作者集群的另一种方式。 Storm也可被用于“连续计算”（continuous computation），对数据流做连续查询，在计算时就将结果以

jopen 2013-11-13 35568 0

Storm 分布式/云计算/大数据

处理大数据机器学习的问题，当你正在研究的数据量大到不能在一台机器上运行时，就可以选择使用Mahout，让你的数据在Hadoop集群的进行分析。Mahout某些部分的实现直接创建在Hadoop之上，这就使得其具有进行大数据

jopen 2013-12-06 71565 0

Mahout Hadoop 算法

5 ）磁盘空间根据个人物理机配置，固定大小运行更快。 6 ）磁盘位置 7 ）数据传输共享粘贴板和鼠标拖放的实现还需要系统安装结束后安装增强功能。 8 ）软驱去除勾选。

jopen 2014-03-14 61471 0

Hadoop 分布式/云计算/大数据

Apache Tez是基于Hadoop Yarn之上的DAG（有向无环图，Directed Acyclic Graph）计算框架。它把Map/Reduce过程拆分成若干个子过程，同时可以把多个Map/

jopen 2014-05-21 40860 0

分布式/云计算/大数据 Apache Tez

同时支持内存和CPU两种资源的调度（默认只支持内存，如果想进一步调度CPU，需要自己进行一些配置），本文将介绍Hadoop YARN是如何对这些资源进行调度和隔离的。在YARN中，资源管理由ResourceMa

jopen 2014-07-09 14872 0

Hadoop 分布式/云计算/大数据

对于hadoop HDFS 中的所有命令进行解析接口名称功能操作流程 get 将文件复制到本地文件系统。如果指定了多个源文件，本地目的端必须是一个目录。（1 ）按照上述机制，在Config

jopen 2014-07-10 14097 0

Hadoop 分布式/云计算/大数据

hadoop是大数据处理的平台，是基于linux系统下的，在windows安装hadoop，很是费劲，连平台搭建都那么难在上面运行代码就更难了，这不是windows的强项，你们都懂得！！hadoop的

jopen 2016-01-04 22817 0

分布式/云计算/大数据

Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。它能提供高吞吐量的数据访问，非常适合大规模数据集上的

jopen 2015-09-12 12038 0

Hadoop 分布式/云计算/大数据

，性能不够好。通常这种海量数据OLAP场景，要不走预处理的路，比如像EBAY麒麟这样走Cube管理的，或者像谷歌Mesa这样按业务需求走预定义聚合操作。再有就是自己构建数据通道，串接实时和批量处理两种系统，发挥各自的特长。

RuthieNatio 2016-03-04 16578 0

分布式/云计算/大数据

) [hadoop@hftest0001 hadoop]$ pwd /home/hadoop/hadoop-2.7.1/etc/hadoop [hadoop@hftest0001 hadoop]$ cat masters

SharonHarde 2016-01-28 11070 0

分布式/云计算/大数据

摘要：最近也是刚刚入门hadoop，配置环境就折腾了很久，在网上也查看了给位大神的帖子，从中也学到了很多东西，但是很多都是比较杂，在这里我就贴出我配置的一些心得，望各位指教。一、简介二、

jopen 2016-01-18 8458 0

分布式/云计算/大数据

如果你是世界上广大 Hadoop 用户的一员，你肯定知道 Google 曾经靠着分布式计算技术（Hadoop），在搜索引擎和广告方面取得了举世瞩目的成就。现在的 Hadoop 不仅是当年的老二 Yahoo

openkk 2012-06-06 13144 0

Hadoop

CURRENT=`date +%Y%m%d` #对数据进行清理，保存到cleaned文件夹，按照当前日期进行保存 /home/cloud/hadoop/bin/hadoop jar /home/cloud/cleaner

jopen 2015-04-13 13454 0

Hadoop 分布式/云计算/大数据

Hadoop招聘数据的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

Java FreeMarker Linux 移动开发模板引擎 C/C++ RedHat OpenCV Selenium 虚拟化 Java开发 Android开发图形/图像处理 .NET开发 ERP/CRM FTP服务器电话/通讯/IM聊天 UML建模 UI开发框架嵌入式开发 Groovy 测试工具

Kafka实战：从RDBMS到Hadoop，七步实现实时传输经验

分布式运算平台-Hadoop-基础篇文档

MapReduce详解及Eclipse远程连接Hadoop开发MapReduce程序文档

CentOS6.2 下 Hadoop 全分布式集群配置文档文档

Hadoop开发环境搭建(Win8+Linux) 文档

Hadoop HDFS分布式文件系统设计要点与架构经验

Hadoop集群部署及常见问题超细详解答经验

Spring hadoop之发散之Storm云计算学习摘录总结经验

利用Mahout实现在Hadoop上运行K-Means算法经验

Hadoop 2.3.0 分布式集群搭建图文经验

基于Hadoop Yarn的DAG（有向无环图）计算框架：Apache Tez 经验

Hadoop YARN中内存和CPU两种资源的调度和隔离经验

基于key/value+Hadoop HDFS 设计的存储系统的shell命令接口经验

云平台hadoop搭建以及wordcount实例运行经验

Hadoop分布式文件系统HDFS的工作原理详述经验

KUDU － Cloudera开发的又一个Hadoop系存储系统经验

【hadoop 2.7.1 】动态添加节点、删除节点经验

Hadoop2.2.0单节点安装和配置环境图文详解经验

IT企业利用云计算平台Hadoop的10种方式资讯

使用hadoop平台进行小型网站日志分析经验

Hadoop招聘数据的相关搜索

关键词

Kafka实战：从RDBMS到Hadoop，七步实现实时传输 经验

分布式运算平台-Hadoop-基础篇 文档

MapReduce详解及Eclipse远程连接Hadoop开发MapReduce程序 文档

CentOS6.2 下 Hadoop 全分布式集群配置文档 文档

Hadoop开发环境搭建(Win8+Linux) 文档

Hadoop HDFS分布式文件系统设计要点与架构 经验

Hadoop集群部署及常见问题超细详解答 经验

Spring hadoop之发散之Storm云计算学习摘录总结 经验

利用Mahout实现在Hadoop上运行K-Means算法 经验

Hadoop 2.3.0 分布式集群搭建图文 经验

基于Hadoop Yarn的DAG（有向无环图）计算框架：Apache Tez 经验

Hadoop YARN中内存和CPU两种资源的调度和隔离 经验

基于key/value+Hadoop HDFS 设计的存储系统的shell命令接口 经验

云平台hadoop搭建以及wordcount实例运行 经验

Hadoop分布式文件系统HDFS的工作原理详述 经验

KUDU － Cloudera开发的又一个Hadoop系存储系统 经验

【hadoop 2.7.1 】动态添加节点、删除节点 经验

Hadoop2.2.0单节点安装和配置环境图文详解 经验

IT企业利用云计算平台Hadoop的10种方式 资讯

使用hadoop平台进行小型网站日志分析 经验

Hadoop招聘数据 的相关搜索

关键词

Kafka实战：从RDBMS到Hadoop，七步实现实时传输经验

分布式运算平台-Hadoop-基础篇文档

MapReduce详解及Eclipse远程连接Hadoop开发MapReduce程序文档

CentOS6.2 下 Hadoop 全分布式集群配置文档文档

Hadoop HDFS分布式文件系统设计要点与架构经验

Hadoop集群部署及常见问题超细详解答经验

Spring hadoop之发散之Storm云计算学习摘录总结经验

利用Mahout实现在Hadoop上运行K-Means算法经验

Hadoop 2.3.0 分布式集群搭建图文经验

Hadoop YARN中内存和CPU两种资源的调度和隔离经验

基于key/value+Hadoop HDFS 设计的存储系统的shell命令接口经验

云平台hadoop搭建以及wordcount实例运行经验

Hadoop分布式文件系统HDFS的工作原理详述经验

KUDU － Cloudera开发的又一个Hadoop系存储系统经验

【hadoop 2.7.1 】动态添加节点、删除节点经验

Hadoop2.2.0单节点安装和配置环境图文详解经验

IT企业利用云计算平台Hadoop的10种方式资讯

使用hadoop平台进行小型网站日志分析经验

Hadoop招聘数据的相关搜索