spark on hive 和 hive on spark 的区别：

发布时间：2022-08-19 12:33

spark on hive :

hive只作为存储角色，spark 负责sql解析优化，底层运行的还是sparkRDD

具体可以理解为spark通过sparkSQL使用hive语句操作hive表，底层运行的还是sparkRDD，

步骤如下：

1.通过sparkSQL，加载Hive的配置文件，获取Hive的元数据信息

2.获取到Hive的元数据信息之后可以拿到Hive表的数据

3.通过sparkSQL来操作Hive表中的数据

hive on spark:

hive既作为存储又负责sql的解析优化，spark负责执行

这里Hive的执行引擎变成了spark，不再是MR。

这个实现较为麻烦，必须重新编译spark并导入相关jar包

目前大部分使用spark on hive

相关推荐

openCV C++ 图像拼接

兼容PyTorch，25倍性能加速，OneFlow“超速”了

【CVE-2020-1472域内提权漏洞】

[ROC-RK3568-PC] 手把手教你打包能使用Etcher或dd命令烧写的Ubuntu系统固件

python的endswith()的使用方法及实例

大前端2022版全面升级某课完结

Nginx反向代理WebSocket服务连接报错：WebSocket connection to “wss://xxx/xxx“ failed

【2022新生学习】第一周要点

js实现数学表达式计算，并兼容中文数字计算

特征提取方法：One-hot、TF-IDF、Word2vec

高并发系统中库存热点的解决方案

华为云王楠楠：分布式云原生全域调度的技术和实践

300道Java面试题(包括计算机基础)，少走弯路

小项目：生成随机的测验试卷文件_python

数据分析/数据挖掘

判断深度学习模型的稳定性_人工智能干货｜一线工程师带你学习深度学习模型量化理论+实践...

论文解读（KP-GNN）《How Powerful are K-hop Message Passing Graph Neural Networks》

国外的公司都是如何对待大龄程序员的？在国内该如何应对？

HarmonyOS应用开发（目录、基本规则、创建项目）

Java实现世界上最快的排序算法Timsort的示例代码

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网，如有侵权请联系：561261067@qq.com

桂ICP备16001015号