Hive的数据类型
hive的基本数据类型
  1.基本数据类型
  hive类型      说明      java类型    实例
  1).tinyint      1byte有符号的整数  byte        20
  2).smalint      2byte有符号的整数    short        20
  3).int        4byte有符号的整数  int        20
  4).bigint      8byte有符号的整数  long       20
  5).boolean    布尔类型true或false    boolean     true
  6).float     单精度        float                  3.217
  7).double    双精度        double              3.212
  8).string     字符序列,单双即可  string          ‘zhang’;“ashakjds”
  9).timestamp   时间戳,精确的纳秒  timestamp        ‘158030219111’
  10).binary     字节数组      byte[]
hive 字符串转数组
  2.集合数据类型
    hive类型    说明                    java类型          实例  1).struct       对象类型,可以通过字段名.元素名来访问    object         
struct('name','age')
  2).map       ⼀组键值对的元组                map           
map('name','zhangsan','age','23')
  3).array         数组                    array           
array('name','age')
  4).union         组合
  3.案例:
    hive>create table employees(
      > name string,
      > salary float,
      > subordinates array<string>,
      > deductions map<string,float>,
      > address struct<street:string,city:string,state:string,zip:int>
      > );
hive的数据编码格式
  1.默认hive通过^A(\001)、^B(\002)、^C(\003)分别对列、(array和struct)、map进⾏匹配;
  2.创建表时,可以通过以下命令进⾏设置:
    row format delimited
    fields terminated by '\001'
    collection items terminated by '\002'
    map keys terminated by '\003'
    lines terminated by '\n'
  3.加载数据
    $>cd ~
    $>cp /mnt/hgfs/2.安装环境/data/ .
    hive> load data local inpath '/home/' into table employees;
    hive>select * from employees;
hive的读时模式
  1.传统的关系型数据库在进⾏数据加载时,必须验证数据格式是否符合表字段定义,如果不符合,数据将⽆法插⼊⾄数据库表中。这种模式称为“写时模式”。
  2.hive中,数据加载过程采⽤“读时模式”。
hive数据存在什么地⽅
  1.数据将存储在hdfs中,在{/user/hive/warehouse/}⽬录的*_db下⾯。
  删除表中的全部数据,你将执⾏$>hadoop fs -rm /user/hive/warehouse/

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。