Hive内置数据类型

一、概述

Hive的内置数据类型可以分为两大类:

  1. 基础数据类型
  2. 复杂数据类型

二、基本数据类型包括

数据类型所占字节开始支持版本
TINYINT1byte,-128 ~ 127 
SMALLINT2byte,-32,768 ~ 32,767  
INT 4byte,-2,147,483,648 ~ 2,147,483,647 
BIGINT 8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807 
BOOLEAN  
FLOAT4byte单精度 
DOUBLE8byte双精度  
STRING  
BINARY  从Hive0.8.0开始支持
TIMESTAMP 从Hive0.8.0开始支持
DECIMAL 从Hive0.11.0开始支持
CHAR 从Hive0.13.0开始支持
VARCHAR 从Hive0.12.0开始支持
DATE 从Hive0.12.0开始支持

三、复杂类型包括

  1. ARRAY:ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;
  2. MAP:MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist['username']来得到这个用户对应的password;
  3. STRUCT:STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
  4. UNION: UNIONTYPE,他是从Hive 0.7.0开始支持的。

四、创建一个包含复杂类型的表

hive> CREATE TABLE emp (
    >     name STRING,
    >     salary FLOAT,
    >     subordinates ARRAY<STRING>,
    >     deductions MAP<STRING, FLOAT>,
    >     address STRUCT<id:INT,city:STRING>
    > ) PARTITIONED BY (country STRING, state STRING);

转载至:http://blog.csdn.net/chenxingzhen001/article/details/20901045

相关推荐