hive入门到魔改-阶段一(hive概念&安装&初步使用)

发布时间：2022-11-20 17:30

Hive简介

官网:

Apache Hive

Hive 是一个构建在 Hadoop 之上的数据仓库，它可以将结构化的数据文件映射成表，并提供类 SQL 查询功能，用于查询的 SQL 语句会被转化为 MapReduce 作业，然后提交到 Hadoop 上运行。

特点：

简单、容易上手 (提供了类似 sql 的查询语言 hql)，使得精通 sql 但是不了解 Java 编程的人也能很好地进行大数据分析；
灵活性高，可以自定义用户函数 (UDF) 和存储格式；
为超大的数据集设计的计算和存储能力，集群扩展容易;
统一的元数据管理，可与 presto／impala／sparksql 等共享数据；
执行延迟高，不适合做数据的实时处理，但适合做海量数据的离线处理。

Hive的体系架构

command-line shell & thrift/jdbc

可以用 command-line shell 和 thrift／jdbc 两种方式来操作数据：

command-line shell：通过 hive 命令行的的方式来操作数据；
thrift／jdbc：通过 thrift 协议按照标准的 JDBC 的方式操作数据。

相关推荐

自学狂神说SpringBoot全网最细笔记没有之一

python数据分析开发环境_搭建python数据分析环境

LeetCode 386. 字典序排数

python+selenium的web自动化—PageObject模式解析及案例

【docker专栏5】详解docker镜像管理命令

炸锅了，MySQL表500W行，居然有人不做分区？

redis哨兵集群搭建详细过程

前端实现打印功能

宏晶STC单片机使用STC-ISP串口烧录失败的解决方法及实例汇总 (Ver0.99.16)

最新论文笔记(+19)：Biscotti_ A Blockchain System for Private and Secure Federated Learning / TPDS21

vue-cli 图片和第三方资源放的地方

李宏毅深度强化学习笔记

python实现通讯录管理系统

什么是小程序直播？小程序直播有哪些优势？

C++实例分析组合数的计算与排列组合的产生

RCGI 专栏 | 海外社交市场调研之应用篇

YOLOV5 代码复现以及搭载服务器运行

面试官：了解Fuzzing Test吗？

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网，如有侵权请联系：561261067@qq.com

桂ICP备16001015号