spark on hive 和 hive on spark 的区别：

发布时间：2022-08-19 12:33

spark on hive :

hive只作为存储角色，spark 负责sql解析优化，底层运行的还是sparkRDD

具体可以理解为spark通过sparkSQL使用hive语句操作hive表，底层运行的还是sparkRDD，

步骤如下：

1.通过sparkSQL，加载Hive的配置文件，获取Hive的元数据信息

2.获取到Hive的元数据信息之后可以拿到Hive表的数据

3.通过sparkSQL来操作Hive表中的数据

hive on spark:

hive既作为存储又负责sql的解析优化，spark负责执行

这里Hive的执行引擎变成了spark，不再是MR。

这个实现较为麻烦，必须重新编译spark并导入相关jar包

目前大部分使用spark on hive

相关推荐

揭开服务网格～Istio Service Mesh神秘的面纱

C++案例（2）——利用C++实现职工管理系统

Spring Boot下配置Spring Data Jpa项目

ImageNet数据集 & 下载

强推 | 学习自然语言处理（NLP）的学习方法和资料合集

【攻克java集合系列（完结）】Java集合全面总结

牛客真题编程——day1

H5查看pdf文件（pdfh5）

java常见log日志的使用方法解析

[ROC-RK3568-PC] 手把手教你打包能使用Etcher或dd命令烧写的Ubuntu系统固件

申请软著代码复制注释和空行

Unity-2D像素晶格化消融

Docker构建镜像的两种方式实现

Python pandas DataFrame数据拼接方法

人均月薪7.6万！腾讯一季度营收超千亿；突破 1nm！台积电祭出“半金属”取代硅材料；苹果与微软竞争再升温 | EA周报...

vue根目录下的index.html中的id="app"与src目录下的App.vue中的id="app"为什么不会冲突

语句和表达式有什么不同

k8s——pod进阶（资源限制与探针）

注解_案例_简单的测试框架

第二章、Android UI 布局 - Android移动开发基础笔记

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网，如有侵权请联系：561261067@qq.com

桂ICP备16001015号