Hive on spark执行子查询报错code3

j0happy

2024-04-28 帮助2人

原始数据：

1001 2022-05-01

1001 2022-05-02

1001 2022-05-04

1001 2022-05-05

1001 2022-05-08

1001 2022-05-10

1002 2022-05-01

1002 2022-05-03

1002 2022-05-05

1002 2022-05-07

1002 2022-05-09

1002 2022-05-13

1002 2022-05-14

建表语句：

create table test2(
id string,
dt string)
row format delimited fields terminated by '\t';

插入数据：

load data local inpath '/opt/module/hive/datas/test2.txt' into table test2;

查询语句：

select
id,
dt,
sum(if(days>2,1,0)) over(partition by id order by dt) g_id
from
(select
id,dt,datediff(dt,lag(dt,1,"1970-01-01")over(partition by id order by dt)) days
from test2)t1

报错信息：

学新通

解决办法：关闭hive的CBO优化

set hive.cbo.enable=false;

再次执行：顺利得到结果

学新通

猜测原因：

hive4.0.0之前版本的CBO优化（4.0.0版本解决了一些bug）

不支持

select

xxx

from(

select

yyy

from tmp

)t1

格式的查询语句，测试集群用的是3.1.2版本，所以需要把默认开启的CBO优化关闭。

这篇好文章是转载于：编程之路

Hive on spark执行子查询报错code3

解决办法：关闭hive的CBO优化

猜测原因：

photoshop保存的图片太大微信发不了怎么办

《学习通》视频自动暂停处理方法

word里面弄一个表格后上面的标题会跑到下面怎么办

Android 11 保存文件到外部存储，并分享文件

photoshop扩展功能面板显示灰色怎么办

微信公众号没有声音提示怎么办

excel下划线不显示怎么办

excel打印预览压线压字怎么办

TikTok加速器哪个好免费的TK加速器推荐

怎样阻止微信小程序自动打开