0推荐
27K 浏览

Hive与HBase集成

Hive与HBase集成
jopen 10年前   
0推荐
23K 浏览

Hive查询

通过Hive提供的order by子句可以让最终的输出结果整体有序。但是因为Hive是基于Hadoop之上的,要生成这种整体有序的结果,就必须强迫Hadoop只利用一个Reduce来完成处理。这...
jopen 10年前   
0推荐
43K 浏览

Hive配置运行及表的操作

Hive的配置文件名为hive-site.xml,你可以在Hive安装目录下的conf目录下找到这个文件。如果你发现该目录下没有这个文件,你可以通过复制hive-default.xml.temp...
jopen 10年前   
0推荐
20K 浏览

Hive安装简介

Hive是基于Hadoop的数据仓库平台。 Hive提供了类SQL查询语言。Hive的数据存储于HDFS中。一般情况下,用户提交的查询将被Hive转换为MapReduce作业并提交给Had...
jopen 10年前   
0推荐
20K 浏览

Hive自定义函数

当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF:user-defined function)。
jopen 10年前   
0推荐
32K 浏览

从 MapReduce 到 Hive —— 一次迁移过程小记

早先的工作中,有很多比较复杂的分析工作,当时对hive还不熟悉,但是java比较熟悉,所以在进行处理的时候,优先选择了MR. 但是随着工作的数据内容越来越多,越来越复杂,对应的调整也越来越多,越来越复杂.
0推荐
23K 浏览

hive指南

hive是基于hadoop构建的数据仓库基础架构,通过提供一系列的工具,使得用户能够方便的做数据ETL,数据结构化,并针对存放在hadoop上的海量数据进行查询和分析。
0推荐
62K 浏览

Hive函数大全

Hive函数大全
jopen 10年前   
0推荐
48K 浏览

基于hive的日志数据统计实战

hive 是一个基于 hadoop 的开源数据仓库工具,用于存储和处理海量结构化数据。 它把海量数据存储于 hadoop 文件系统,而不是数据库,但提供了一套类数据库的数据存储和处理...
0推荐
24K 浏览

Hive代码组织及架构简单介绍

Serialzers/Deserialzers(trunk/serde) 此组件允许用户自己开发自定义序列化、反序列化文件解析器,hive自身也内置了一些序列化解析类。 MetaSto...
jopen 10年前   
0推荐
26K 浏览

hive优化要点总结

个人认为总体两种思想: 1、让服务器尽可能的多做事情,榨干服务器资源,以最高系统吞吐量为目标 再好的硬件没有充分利用起来,都是白扯淡。
jopen 10年前   
0推荐
107K 浏览

Hive 查询优化总结

Join查找操作的基本原则:应该将条目少的表/子查询放在 Join 操作符的左边。原因是在 Join 操作的 Reduce 阶段,位于 Join 操作符左边的表的内容会被加载进内存,将条目少的表...
0推荐
35K 浏览

Hive 安装过程

Hive 安装过程
0推荐
32K 浏览

数据仓库Hive管理软件 phpHiveAdmin

这是一个由php编写的hadoop hive查询工具,可以方便的查询hive中的数据和相关信息。
fmms 12年前   
0推荐
44K 浏览

hadoop hive sql语法详解

hadoop hive sql语法详解
1 2

经验分享,提升职场影响力

投稿

热门问答

    热门文档