发布时间:2022-08-19 12:58
一、创建测试表
CREATE TABLE `ittemp`.`zxh_test1` (
`col1` VARCHAR(64) COMMENT '测试字段1',
`col2` INT COMMENT '测试字段2',
`col3` DECIMAL(16,2) COMMENT '测试字段3'
)
stored as parquet
PARTITIONED BY (`dt` varchar(8) comment '分区')
COMMENT '测试表1';
二、插入测试数据
insert overwrite `ittemp`.`zxh_test1` partition(dt='20220707') values ('a',1,1.1);
三、spark查询测试
select * from `ittemp`.`zxh_test1`;
四、通过hive新增字段
alter table `ittemp`.`zxh_test1` add columns ( `COL4` VARCHAR(40) comment '测试字段4');
五、spark查询测试(报hive metastore不一致)
select * from `ittemp`.`zxh_test1`;
六、通过hive更新TBLPROPERTIES
1、通过hive执行show create table `ittemp`.`zxh_test1`查看tblproperties信息
注:一般关注'spark.sql.sources.schema.part.0'参数值,当表字段过多时,可能存在 'spark.sql.sources.schema.part.1'、'spark.sql.sources.schema.part.2'等多个,需要关注涉及更新的字段信息在哪个参数里
2、 更新tblproperties值
alter table `ittemp`.`zxh_test1` set TBLPROPERTIES
(
'spark.sql.sources.schema.part.0'='{"type":"struct","fields":[{"name":"col1","type":"varchar(64)","nullable":true,"metadata":{"comment":"测试字段1"}},{"name":"col2","type":"integer","nullable":true,"metadata":{"comment":"测试字段2"}},{"name":"col3","type":"decimal(16,2)","nullable":true,"metadata":{"comment":"测试字段3"}},{"name":"col4","type":"varchar(40)","nullable":true,"metadata":{"comment":"测试字段4"}},{"name":"dt","type":"varchar(8)","nullable":true,"metadata":{"comment":"分区"}}]}'
);
七、再次通过spark查询,hive metastore不一致告警消失
select * from `ittemp`.`zxh_test1`;
【车牌识别】基于GRNN广义回归神经网络的车牌识别matlab仿真
0.1.3 合宙CORE-ESP32-C3开发板用arduino点亮ST7735 1.8寸TFT屏【已更新失效链接2022.07.10】
使用 Helm 3 包管理器在 Kubernetes 集群上安装软件
非侵入式负荷监测_学术简报︱电力负荷识别的新方法,平均识别率超98%
物联网之MQTT3.1.1和MQTT5协议 (2) CONNECT报文
【Docker系列】从头学起 Docker——docker start 命令详解
Camunda实战练习:Camunda 简单下载,安装,搭建(一)
windows部署python项目(以Flask为例)到docker,通过脚本一键生成dockerfile并构建镜像启动容器