开源项目,开源代码,开源文档,开源新闻,开源社区

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导入到Hadoop的HDFS中，也可以将HDFS的数据导入到关系型数据库中。

jopen 2014-11-27 8376 0

Hadoop

Software Integrators的总裁和创始人。长时间的使用Hadoop，他发现了这12件事情真的影响了Hadoop的易用性。 Hadoop是一个很神奇的创造，但它发展过快而表现出一些瑕疵。我爱大象

jopen 2014-10-27 8709 0

Hadoop

环境部署Hadoop系统的用户来说，最常遇到的就是扩展问题，此类问题往往导致企业因噎废食，终止大数据应用项目。部署和扩展Hadoop系统是一件高度复杂的事情，如果用户能提前对Hadoop扩展可能

jopen 2014-09-23 6890 0

Hadoop

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导入到Hadoop的HDFS中，也可以将HDFS的数据导入到关系型数据库中。

jopen 2015-02-28 14190 0

Apache Sqoop

Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-06-29 9747 0

Apache Hive

要解决他们的hadoop，spark的开发环境就行了。本文的重点有两个，第一，使用weave解决跨主机通信，第二，实际使用当中，开放端口调试程序和webUI监控等。至于hadoop，spark本身的安装配置等参数并没有涉及。

jopen 2016-02-24 36540 0

Spark Docker Hadoop

P12

Hadoop和HBase分布式配置及整合My Eclipse开发 Q:620734263 说明：本文档主要侧重hadoop和hbase在windows下的开发.在linux上开发自行修改即可. 一、

caiyifeng 2012-11-17 10033 0

Hadoop 分布式/云计算/大数据

光环国际公开课—Hadoop大数据处理技术及其实践开课时间： 2015年1月16日、17日咨询电话：400-7060-559 010-846754957 课程内容采用递进式，分为三个模块分享：

3173130229 2014-12-28 14984 0

数据库 ci 云计算 C/C++

P31

1. 基于Hadoop生态技术构建阿里搜索离线系统阿里巴巴一淘及搜索技术部——任春德/瓦力 2. 个人简介任春德，花名瓦力阿里巴巴一淘及搜索事业部曾就职于阿里集团雅虎中国、阿里云、淘宝子公司，关注

byc2 2014-11-19 1874 0

Hadoop 分布式/云计算/大数据方案 Java SQL

基本概念与安装部署级别：初级曹羽中 ( caoyuz@cn.ibm.com ), 软件工程师, IBM中国开发中心 2008 年 5 月 22 日 Hadoop 是一个实现了MapReduce

Hadoopp 2012-09-28 1472 0

程序实例与分析 Hadoop 是一个实现了MapReduce 计算模型的开源分布式并行编程框架，借助于Hadoop, 程序员可以轻松地编写分布式并行程序，将其运行于计算机集群上，完成海量数据的计算

Hadoopp 2012-09-28 1535 0

JavaScript开发文件上传下载

在安装Fedora 11的两台机器上的目录结构一致，分别安装JRE 6 Update 14，下载hadoop 0.20后解压放在目录/home/hadoop/下。hadoop包解压以后的路径名字是hadoop-0

Hadoopp 2012-09-28 1086 0

JavaScript开发 Apache Cayenne 酸橙派

P26

increment(1); return; } } 内存buffer的格式如下： (见几位hadoop大侠的分析http://blog.csdn.net/HEYUTAO007/archive/2010/07/10/5725379

huafenged 2012-02-24 2954 0

Hadoop 分布式/云计算/大数据

P18

hadoop搭建与eclipse开发环境设置　　　 ――罗利辉 1. 前言 1.1 目标目的很简单，为进行研究与学习，部署一个hadoop运行环境，并搭建一个hadoop开发与测试环境。具体目标是：

li270606338 2013-08-28 4101 0

Hadoop 分布式/云计算/大数据

Apache HCatalog是基于Apache Hadoop之上的数据表和存储管理服务。包括：提供一个共享的模式和数据类型的机制。抽象出表，使用户不必关心他们的数据怎么存储。提供可操作的

openkk 2012-06-09 39460 0

Hadoop 分布式/云计算/大数据

引言 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时，它和其他的分布式文件

jopen 2013-02-02 15835 0

Hadoop 分布式/云计算/大数据

Microsoft .NET SDK For Hadoop 是个 Hadoop WebClient 的 .NET SDK。这个工具包提供 .NET API ，用来访问 HDInsight 方面（HDFS，HCatalag，Oozie

jopen 2014-04-08 63765 0

Hadoop .NET开发

个单节点的Hadoop集群，不需要设置任何环境变量和管理配置文件。这个CLI Mini集群将会启动Yarn/MapReduce和HDFS。这个案例适合想要快速体验一个真实的Hadoop集群或者测试一个没有java程序的功能。

jopen 2014-10-31 13426 0

Hadoop 分布式/云计算/大数据

用提取的信息建立一个推荐但是，一切从基础开始！如果你是第一次接触Apache Hadoop和Azure上的Hadoop，我建议你在开始之前阅读这些介绍性的文章，在我介绍HDInsight和Map

jopen 2013-07-17 33383 0

Hadoop Mahout

是一个高度模块化的系统。它为存储在Apache Hadoop集群中的数据和元数据提供了细粒度的、基于角色的认证功能。 Hadoop生态圈中的项目有着各自不同的、需要单独配置的认证系统。Hadoop的灵活性使得生态圈中不同的项目（如Hive、Solr、

jopen 2014-08-24 13274 0

分布式/云计算/大数据 Apache Sentry

Hadoop 与关系数据库相互迁移，Apache Sqoop 1.99.4 发布资讯

为什么如此难用？Hadoop 的 12 个技术痛点资讯

Hadoop遭遇瓶颈的七大危险信号资讯

Apache Sqoop 1.99.5 发布，Hadoop 数据迁移资讯

基于Hadoop的数据仓库平台，Apache Hive 1.2.1 发布资讯

在Docker上使用Weave搭建Hadoop和Spark跨主机容器集群资讯

Hadoop 和 HBase 分布式配置及整合 MyEclipse 开发文档

光环国际公开课—Hadoop大数据处理技术及其实践问答

基于Hadoop生态技术构建阿里搜索离线系统文档

用Hadoop 进行分布式并行编程（一）博客

用Hadoop进行分布式并行编程（二）博客

Hadoop 0.20的配置过程和配置文件(分布式) 博客

hadoop学习总结之四：Map-Reduce的过程解析文档

hadoop搭建与eclipse开发环境设置及远程调试文档

HCatalog - 基于Hadoop数据表和存储管理服务经验

Hadoop 分布式文件系统：架构和设计经验

微软的开源 Hadoop 的 .NET SDK 开发包经验

Hadoop MapReduce下一代 - 命令行Mini集群经验

使用 Azure、Hadoop 和 Mahout 构建一个推荐系统经验

为Hadoop数据细粒度的、基于角色的认证功能：Apache Sentry 经验

Ubuntu 安装hadoop 的相关搜索

关键词

Hadoop 与关系数据库相互迁移，Apache Sqoop 1.99.4 发布 资讯

为什么如此难用？Hadoop 的 12 个技术痛点 资讯

Hadoop遭遇瓶颈的七大危险信号 资讯

Apache Sqoop 1.99.5 发布，Hadoop 数据迁移 资讯

基于Hadoop的数据仓库平台，Apache Hive 1.2.1 发布 资讯

在Docker上使用Weave搭建Hadoop和Spark跨主机容器集群 资讯

Hadoop 和 HBase 分布式配置及整合 MyEclipse 开发 文档

光环国际公开课—Hadoop大数据处理技术及其实践 问答

基于Hadoop生态技术构建阿里搜索离线系统 文档

用Hadoop 进行分布式并行编程（一） 博客

用Hadoop进行分布式并行编程（二） 博客

Hadoop 0.20的配置过程和配置文件(分布式) 博客

hadoop学习总结之四：Map-Reduce的过程解析 文档

hadoop搭建与eclipse开发环境设置及远程调试 文档

HCatalog - 基于Hadoop数据表和存储管理服务 经验

Hadoop 分布式文件系统：架构和设计 经验

微软的开源 Hadoop 的 .NET SDK 开发包 经验

Hadoop MapReduce下一代 - 命令行Mini集群 经验

使用 Azure、Hadoop 和 Mahout 构建一个推荐系统 经验

为Hadoop数据细粒度的、基于角色的认证功能：Apache Sentry 经验

Ubuntu 安装hadoop 的相关搜索

关键词

Hadoop 与关系数据库相互迁移，Apache Sqoop 1.99.4 发布资讯

为什么如此难用？Hadoop 的 12 个技术痛点资讯

Hadoop遭遇瓶颈的七大危险信号资讯

Apache Sqoop 1.99.5 发布，Hadoop 数据迁移资讯

基于Hadoop的数据仓库平台，Apache Hive 1.2.1 发布资讯

在Docker上使用Weave搭建Hadoop和Spark跨主机容器集群资讯

Hadoop 和 HBase 分布式配置及整合 MyEclipse 开发文档

光环国际公开课—Hadoop大数据处理技术及其实践问答

基于Hadoop生态技术构建阿里搜索离线系统文档

用Hadoop 进行分布式并行编程（一）博客

用Hadoop进行分布式并行编程（二）博客

hadoop学习总结之四：Map-Reduce的过程解析文档

hadoop搭建与eclipse开发环境设置及远程调试文档

HCatalog - 基于Hadoop数据表和存储管理服务经验

Hadoop 分布式文件系统：架构和设计经验

微软的开源 Hadoop 的 .NET SDK 开发包经验

Hadoop MapReduce下一代 - 命令行Mini集群经验

使用 Azure、Hadoop 和 Mahout 构建一个推荐系统经验