在Hive使用过程中,有时需要通过sql语句来创建复杂数据类型,例如ARRAY、MAP、STRUCT等,甚至还有嵌套的复杂数据类型例如ARRAY[STRUCT],有必要了解一下sql语句中复杂数据类型的创建。
函数名称 | 函数参数 | 函数说明 |
---|---|---|
map | (key1,value1,key2,value2,…) | 创建了一个map结构数据,函数参数依次是它的key和value |
有两种方式,如下表:
函数名称 | 函数参数 | 函数说明 |
---|---|---|
struct | (val1,val2,val3,…) | 创建了一个struct数据字段,它里面的字段的名称依次为col1,col2,col3…,它的值依次为val1,val2,val3 |
named_struct | (name1,val1,name2,val2,…) | 创建了一个struct字段,函数中的参数依次为key和value |
函数名称 | 函数参数 | 函数说明 |
---|---|---|
array | (val1,val2,val3,…) | 创建了一个array结构数据,里面的数据依次是val1,val2,val3… |
在实际操作中可以使用collect_set+group by的方式生成一个array,如下图:
sql语句:select username, collect_set(video_name) from t_visit_video group by username;
结果如下:
代码如下:
select sku_id, collect_set(named_struct('sale_attr_id',sale_attr_id,'sale_attr_value_id',sale_attr_value_id,'sale_attr_name',sale_attr_name,'sale_attr_value_name',sale_attr_value_name)) sale_attrs from ods_sku_sale_attr_value_full group by sku_id
先把一行里的数据转换成一个struct再group by使用collect_set,生成了一个array[struct]