(四)Hive的数据类型--688IT编程网

（四）Hive的数据类型

H ive的内置数据类型分为两⼤类：1、基础数据类型；2、复杂数据类型。

⼀、基础数据类型包括：

注：

binary：⼆进制类型。

timestamp：带可选的纳秒级精度UNIX timestamp。timestamp与时区⽆关，存储为UNIX纪元的偏移量。Hive提供了⽤于 timestamp和时区相互转换的便利UDF：to_utc_timestamp和 from_utc_timestamp。 Timestamp类型可以使⽤所有的⽇期时间UDF，如month、day、year等。⽂本⽂件中的Timestamp必须使⽤yyyy-mm-dd hh:mm:ss[.f...]的格式，如果使⽤其它格式，将它们声明为合适的类型（INT、FLOAT、STRING等）并使⽤UDF将它们转换为 Timestamp。其⽀持的类型为：

整数类型：转换为秒级的UNIX时间戳。

浮点数类型：转换为带⼩数精度的UNIX时间戳。

字符串类型：适合java.sql.Timestamp格式"YYYY-MM-DD HH:MM:SS.fffffffff"（9位⼩数精度）。

Date：描述了特定的年⽉⽇，以YYYY-M M-D D格式表⽰，例如2014-05-29。仅可与Date、timestamp和String相互转化。

：ARRAY、Map、struct、union，这些复杂类型是由基础⼆、复杂数据类型包括：ARRAY、Map、struct、union，这些复杂类型是由基础⼆、复杂数据类型包括

类型构成的。

ARRAY：ARRAY类型是由⼀系列相同数据类型的元素组成，这些元素可以通过下标来访问。⽐如有⼀个ARRAY类型的变量fruits，它是由['apple','orange','mango']组成，那么我们可以通过fruits[1]来访问元素orange，因为ARRAY类型的下标是从 0开始的；

MAP：MAP包含key->value键值对，可以通过key来访问元素。⽐如”userlist”是⼀个map类型，其中username是 key，password是value；那么我们可以通过userlist['username']来得到这个⽤户对应的password；

STRUCT：STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的⽅式来得到所需要的元素，⽐如user是⼀个STRUCT类型，那么可以通过user.address得到这个⽤户的地址。

UNION：UNIONTYPE，他是从Hive 0.7.0开始⽀持的。

复杂数据类型的使⽤：

复杂数据类型的使⽤

1. Array的使⽤

创建数据库表，以array作为数据类型

create table person(name string,work_locations array)

ROW FORMAT DELIMITED

FIELDS TERMINATED BY '\t'

COLLECTION ITEMS TERMINATED BY ',';

数据

biansutao beijing,shanghai,tianjin,hangzhou

linan changchu,chengdu,wuhan

⼊库数据

LOAD DATA LOCAL INPATH '/home/' OVERWRITE INTO TABLE person;

查询

hive> select * from person;

biansutao ["beijing","shanghai","tianjin","hangzhou"]

linan ["changchu","chengdu","wuhan"]

Time taken: 0.355 seconds

hive> select name from person;

linan

biansutao

Time taken: 12.397 seconds

hive> select work_locations[0] from person; changchu

beijing

Time taken: 13.214 seconds

hive> select work_locations from person;

["changchu","chengdu","wuhan"] ["beijing","shanghai","tianjin","hangzhou"] Time taken: 13.755 seconds

hive> select work_locations[3] from person;

NULL

hangzhou

Time taken: 12.722 seconds

hive> select work_locations[4] from person;

NULL

Time taken: 15.958 seconds

2. Map 的使⽤

创建数据库表

create table score(name string, score map)

ROW FORMAT DELIMITED

FIELDS TERMINATED BY '\t'

COLLECTION ITEMS TERMINATED BY ','

MAP KEYS TERMINATED BY ':';

unix时间戳转换日期格式

要⼊库的数据

biansutao '数学':80,'语⽂':89,'英语':95

jobs '语⽂':60,'数学':80,'英语':99

⼊库数据

LOAD DATA LOCAL INPATH '/home/' OVERWRITE INTO TABLE score;

查询

hive> select * from score;

biansutao {"数学":80,"语⽂":89,"英语":95}

jobs {"语⽂":60,"数学":80,"英语":99}

Time taken: 0.665 seconds

hive> select name from score;

jobs

biansutao

Time taken: 19.778 seconds

hive> select t.score from score t;

{"语⽂":60,"数学":80,"英语":99}

{"数学":80,"语⽂":89,"英语":95}

Time taken: 19.353 seconds

hive> select t.score['语⽂'] from score t;

Time taken: 13.054 seconds

hive> select t.score['英语'] from score t;

Time taken: 13.769 seconds

3 Struct 的使⽤

创建数据表

CREATE TABLE test(id int,course struct) ROW FORMAT DELIMITED

FIELDS TERMINATED BY '\t' COLLECTION ITEMS TERMINATED BY ',';

数据

1 english,80

2 math,89

688IT编程网

(四)Hive的数据类型

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

(四)Hive的数据类型

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式