Hive支持复杂数据类型,如STRUCT、ARRAY和MAP
WHERE
子句过滤Struct类型:假设我们有一个名为employee
的表,其中包含一个名为info
的STRUCT类型字段,该字段包含员工的姓名、年龄和部门信息。
CREATE TABLE employee ( id INT, info STRUCT<name STRING, age INT, department STRING> );
要过滤出年龄大于30岁的员工,可以使用以下查询:
SELECT * FROM employee WHERE info.age > 30;
LATERAL VIEW
和EXPLODE
过滤ARRAY类型:假设我们有一个名为products
的表,其中包含一个名为tags
的ARRAY类型字段,该字段包含产品标签。
CREATE TABLE products ( id INT, tags ARRAY<STRING> );
要过滤出包含"electronics"标签的产品,可以使用以下查询:
SELECT p.* FROM products p LATERAL VIEW INLINE(p.tags) t AS tag WHERE tag = 'electronics';
LATERAL VIEW
和EXPLODE
过滤MAP类型:假设我们有一个名为orders
的表,其中包含一个名为metadata
的MAP类型字段,该字段包含订单元数据。
CREATE TABLE orders ( id INT, metadata MAP<STRING, STRING> );
要过滤出包含"priority"键且值为"high"的订单,可以使用以下查询:
SELECT o.* FROM orders o LATERAL VIEW INLINE(o.metadata) m AS key, value WHERE key = 'priority' AND value = 'high';
这些示例展示了如何在Hive中过滤复杂数据类型。根据实际需求和数据结构,可以相应地调整查询。