spark on hive 和 hive on spark 的区别：

发布时间：2023-02-11 18:00

spark on hive :

hive只作为存储角色，spark 负责sql解析优化，底层运行的还是sparkRDD

具体可以理解为spark通过sparkSQL使用hive语句操作hive表，底层运行的还是sparkRDD，

步骤如下：

1.通过sparkSQL，加载Hive的配置文件，获取Hive的元数据信息

2.获取到Hive的元数据信息之后可以拿到Hive表的数据

3.通过sparkSQL来操作Hive表中的数据

hive on spark:

hive既作为存储又负责sql的解析优化，spark负责执行

这里Hive的执行引擎变成了spark，不再是MR。

这个实现较为麻烦，必须重新编译spark并导入相关jar包

目前大部分使用spark on hive

相关推荐

Vue3 setup中使用生命周期函数

MySQL数据库操作DQL正则表达式

【面试：并发篇16：多线程：wait/notify详解】原理及错误用法(虚假唤醒等)

多线程基础入门学习（带示例代码）

springboot java+redis 实现简单实用的搜索栏热搜功能，不雅文字过滤功能。

zabbix：设置企业微信告警（python3脚本）

前端学习 linux —— 第一篇

CSS的hover属性

解决阿里云ECS服务器下安装MySQL无法远程连接的问题

一、什么Docker？ Docker有什么用？Docker能干嘛？

JavaSE基础知识——异常处理

Python判断和循环语句的分析与应用

Vue3-路由跳转专题详细总结

如何获取 Spring heapdump中的明文密码

SpringBoot框架的基于java的疫情期间网课管理系统

狂神。JavaWeb学习(2)

初识c++中的函数模板

如何优雅的使用MyBatis？

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网，如有侵权请联系：561261067@qq.com

桂ICP备16001015号