0推荐
22K 浏览

英语流利说基础数据平台

随着大数据产品的日益成熟与稳定,如今不少互联网公司在数据产品所投入的运维工作已经越来越少,另外,加上国内云服务的不断普及,建立一套自己的大数据基础平台的成本也将变的更低。本文将向大家简要介绍流利...
0推荐
23K 浏览

从零自学Hadoop(18):Hive的CLI和JDBC

文章是哥(mephisto)写的,SourceLink 上一篇,我们对hive的数据导出,以及集群Hive数据的迁移进行描述。了解到了基本的hive导出操作。这里,我们将对hive的CL...
0推荐
76K 浏览

Hive HWI 安装及配置

备忘,HWI安装过程,整理以前的记录,今又想起来重装一次,居然又遇到新的问题,由于是笔记,有点杂乱。 Hive Web Interface(HWI)简介:Hive自带了一个Web-GUI,功...
0推荐
16K 浏览

Hive安装手册

Hive安装手册
jopen 9年前   
0推荐
14K 浏览

Hive运行架构及配置部署

由Facebook开源,最初用于解决海量结构化的日志数据统计问题:ETL工具; 构建于Hadoop的HDFS和MapReduce智商,用于管理和查询结构化/非结构化数据的数据仓库;
0推荐
16K 浏览

Impala与Hive的比较

Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的 Hive+MapReduce批处理,而是通过使用与商用并行...
0推荐
36K 浏览

深入浅出数据仓库中SQL性能优化之Hive篇

一个Hive查询生成多个Map Reduce Job,一个Map Reduce Job又有Map,Reduce,Spill,Shuffle,Sort等多个阶段,所以针对Hive查询的优化可以大致...
jopen 9年前   
SQL   Hive  
0推荐
18K 浏览

基于Docker的共享计算能力的工具:Hive

Hive是一个基于Docker的共享计算能力的工具,用户只需要在自己的机器上启动Docker进程并提交到Hive平台即可。
0推荐
80K 浏览

Hive在腾讯数据仓库TDW中的应用

Hive是Apache基金会下的一个在Hadoop上构建数据仓库的开源软件,它支持通过类SQL的HQL语言操作结构化数据。Hive的主要功 能是将类SQL的HQL语言翻译成MapReduce代码...
jopen 9年前   
0推荐
24K 浏览

Hive:基于hadoop的数据仓库工具

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为 MapReduce任务进行运行。其优点是学习成本低,可...
jopen 9年前   
0推荐
24K 浏览

Hive:基于hadoop的数据仓库工具

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件 映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可...
0推荐
31K 浏览

Hive实战之日志分析

本文主要讲述使用 hive 的实践,业务不是关键,简要介绍业务场景,本次的任务是对搜索日志数据进行统计分析。 集团搜索刚上线不久,日志量并不大 。这些日志分布在 5 台前端机,按小时保存,并以...
0推荐
37K 浏览

Hive学习的思维导图

Hive学习的思维导图
0推荐
19K 浏览

Hive分区

1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。
0推荐
111K 浏览

Hive权限介绍

目前hive支持简单的权限管理,默认情况下是不开启,这样所有的用户都具有相同的权限,同时也是超级管理员,也就对hive中的所有表都有查看和改动的权利,这样是不符合一般数据仓库的安全原则的。Hiv...
jopen 10年前   
0推荐
28K 浏览

数据仓库中的 SQL 性能优化(Hive篇)

一个Hive查询生成多个map reduce job,一个map reduce job又有map,reduce,spill,shuffle,sort等多个阶段,所以针对hive查询的优化可以大致...
jopen 10年前   
0推荐
64K 浏览

Hive深入浅出

Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hi...
jopen 10年前   
0推荐
76K 浏览

基于 Hive 的文件格式:RCFile 简介及其应用

Hadoop 作为MR 的开源实现,一直以动态运行解析文件格式并获得比MPP数据库快上几倍的装载速度为优势。不过,MPP数据库社区也一直批评Hadoop由于文件格式并非为特定目的而建,因此序列化...
0推荐
176K 浏览

Hive SQL 编译过程详解

Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储和分析。Hive的稳...
jopen 10年前   
0推荐
59K 浏览

Hive详细教程

基于Hadoop的大数据的计算/扩展能力 支持SQL like查询语言 统一的元数据管理 简单编程
jopen 10年前   
Hive  
1 2

经验分享,提升职场影响力

投稿

热门问答

    热门文档