开源项目,开源代码,开源文档,开源新闻,开源社区

a data warehouse infrastructure built on top of Hadoop. It provides tools to enable easy data ETL, a mechanism

jopen 2014-08-31 63675 0

Hive 数据挖掘

P22

道过程是多么的折腾。采用HBase就简单了，只需要加机器即可，HBase会自动水平切分扩展，跟Hadoop的无缝集成保障了其数据可靠性（HDFS）和海量数据分析的高性能（MapReduce）。小结

liu2511981 2012-05-16 2693 0

分布式/云计算/大数据

P29

Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

东皇太一 2011-07-19 479 0

数据挖掘

P23

Hbase分析报告本文基于环境hadoop-0.16.4 和 hbase-0.1.3 编写 Hbase是一个分布式开源数据库，基于Hadoop分布式文件系统，模仿并提供了基于Google文件系统的Bigtable数据库的所有功能。

calmdiss 2013-05-11 321 0

分布式/云计算/大数据

P23

Hbase分析报告本文基于环境hadoop-0.16.4 和 hbase-0.1.3 编写 Hbase是一个分布式开源数据库，基于Hadoop分布式文件系统，模仿并提供了基于Google文件系统的Bigtable数据库的所有功能。

hadoopfans 2010-11-20 4664 0

构架分布式/云计算/大数据报告

P23

Hbase分析报告本文基于环境hadoop-0.16.4 和 hbase-0.1.3 编写 Hbase是一个分布式开源数据库，基于Hadoop分布式文件系统，模仿并提供了基于Google文件系统的Bigtable数据库的所有功能。

nx42 2012-09-07 753 0

分布式/云计算/大数据报告

Web项目中读取HBase的数据。先介绍一下必要的一些环境： HBase的版本：0.98.8-hadoop2 所需的依赖包： commons-codec-1.7.jar commons-collections-3

n342 2015-04-29 99384 0

HBase NoSQL数据库

下面将介绍大数据领域支持Java的主流开源工具： 1. HDFS HDFS是Hadoop应用程序中主要的分布式储存系统， HDFS集群包含了一个NameNode（主节点），这个节点负

jopen 2014-04-30 52548 0

开源

的Git代码库中[2]，感兴趣的读者可以克隆并切换到0.8分支查看。背景：Kylin使用Hadoop结合数据立方体（Cube）技术实现多维度快速OLAP分析能力的。关于数据立方体概念，请参考[3]。

jopen 2015-09-10 25064 0

Apache Kylin

hiveudf; import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; public class

jopen 2014-01-27 20004 0

Hive 数据挖掘

写的类GFS开源项目Hadoop，最开始hadoop的赞助人是yahoo，后来这个项目成了Apche的顶级项目。大数据的解决方案：谷歌的那一套系统是闭源的，开源的Hadoop于是就广泛传播开来了。

jopen 2015-01-28 48655 0

架构分布式/云计算/大数据

· 协议（Protocol）: HTTP/REST (也有 Thrift) · 概要：模型化谷歌大表使用Hadoop HDFS作为数据存储 Hadoop Map/reduce 框架通过服务器端的扫描和过滤来实现查询术语推送实时查询优化

jopen 2014-03-13 23273 0

数据库 NoSQL数据库

Hive是基于Hadoop的数据仓库平台。 Hive提供了类SQL查询语言。Hive的数据存储于HDFS中。一般情况下，用户提交的查询将被Hive转换为MapReduce作业并提交给Hadoop运行。

jopen 2014-01-28 19847 0

Hive 数据挖掘

可以是不同的类型。当前该实现在 Lucene 和 Hadoop mapfiles 让大型高负荷的索引变简单能为许多具有大型Lucene或Hadoop Mapfile 的索引碎片的服务器提供服务在不同服务器上复制碎片以保证性能和容错性

jopen 2012-09-11 21225 0

分布式分布式/云计算/大数据

Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不

jopen 2013-11-13 53687 0

Spark 分布式/云计算/大数据

可以是不同的类型。当前该实现在 Lucene 和 Hadoop mapfiles 让大型高负荷的索引变简单能为许多具有大型Lucene或Hadoop Mapfile 的索引碎片的服务器提供服务在不同服务器上复制碎片以保证性能和容错性

jopen 2014-05-20 19271 0

katta 存储系统分布式/云计算/大数据

SpatialHadoop是对Hadoop的做了一个全面的扩展，使其核心功能可以支持空间数据。因此，对于处理空间数据，SpatialHadoop与目前存在的Hadoop项目相比具有更好的性能。SpatialHadoop主要包括一个

jopen 2016-01-05 24189 0

分布式/云计算/大数据

P53

海量数据“经济方案”------经济便宜的X86服务器海量数据“分而治之”------批量分布式并行计算Hadoop 海量数据“灵活多变”------实时分布式高吞吐高并发数据存取处理NoSQL 海量数据“跨越

xiao_xiong 2013-05-14 3836 0

Oracle 数据库服务器方案报告 Intel

net/jeeker/blog/628470 一、概述我的机器使用hadoop-2.7.2，hbase-1.1.3版本，系统为ubuntu14。 hadoop安装：上一篇文章二、HBase的安装下载地址：

chenyu0532 2016-03-02 9633 0

NoSQL数据库

方式可以分为以下几种：基于物品和用户本身的，这种推荐引擎将每个用户和每个物品都当作独立的实体，预测每个用户对于每个物品的喜好程度，这些信息往往是用一个二维矩阵描述的。由于用户感兴趣的物品远远小于

jopen 2014-12-12 59273 0

推荐引擎

Hive深入浅出经验

业务开发测试hbase之旅文档

Hive开发资料文档

Hbase 分析报告文档

Hbase分析报告文档

Hbase 原理及性能分析报告文档

实战：在Java Web 项目中使用HBase 经验

13款开源Java大数据工具经验

Apache Kylin的快速数据立方体算法 - 概述资讯

Hive自定义函数经验

大数据基础架构总结经验

类似于谷歌大表(Google' Gigtable)的开源数据库经验

Hive安装简介经验

开源分布式存储系统 katta 介绍经验

一个高效的分布式计算系统：Spark 经验

开源分布式存储系统：katta 经验

SpatialHadoop实例：面向空间数据的高效MapReduce框架经验

Oracle大数据解决方案- 文档

HBase伪分布式安装经验

以Amazon、豆瓣网为例，探索推荐引擎内部的秘密经验

hadoop 电影票房预测的相关搜索

关键词

Hive深入浅出 经验

业务开发测试hbase之旅 文档

Hive开发资料 文档

Hbase 分析报告 文档

Hbase分析报告 文档

Hbase 原理及性能分析报告 文档

实战：在Java Web 项目中使用HBase 经验

13款开源Java大数据工具 经验

Apache Kylin的快速数据立方体算法 - 概述 资讯

Hive自定义函数 经验

大数据基础架构总结 经验

类似于谷歌大表(Google' Gigtable)的开源数据库 经验

Hive安装简介 经验

开源分布式存储系统 katta 介绍 经验

一个高效的分布式计算系统：Spark 经验

开源分布式存储系统：katta 经验

SpatialHadoop实例：面向空间数据的高效MapReduce框架 经验

Oracle大数据解决方案- 文档

HBase伪分布式安装 经验

以Amazon、豆瓣网为例，探索推荐引擎内部的秘密 经验

hadoop 电影票房预测 的相关搜索

关键词

Hive深入浅出经验

业务开发测试hbase之旅文档

Hive开发资料文档

Hbase 分析报告文档

Hbase分析报告文档

Hbase 原理及性能分析报告文档

13款开源Java大数据工具经验

Apache Kylin的快速数据立方体算法 - 概述资讯

Hive自定义函数经验

大数据基础架构总结经验

类似于谷歌大表(Google' Gigtable)的开源数据库经验

Hive安装简介经验

开源分布式存储系统 katta 介绍经验

SpatialHadoop实例：面向空间数据的高效MapReduce框架经验

HBase伪分布式安装经验

以Amazon、豆瓣网为例，探索推荐引擎内部的秘密经验

hadoop 电影票房预测的相关搜索