Hive基础之Hive数据类型

摘要:
3) 字符串:JDBC兼容的java。sql。时间戳格式“YYYY-MM-DDHH:MM:SS.ffffffff”注意:1)日期类型在Hive0.12.0中引入。2)十进制类型在Hive 0.11.0中引入,并在Hive 0.13.0中进行了修改。

Hive数据类型

    参考:中文博客:http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2843448.html
          英文:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Types

    1、列类型
       TINYINT
       SMALLINT
       INT
       BIGINT
       BOOLEAN
       FLOAT
       DOUBLE
       STRING
       BINARY(Hive 0.8.0以上才可用)
       TIMESTAMP(Hive 0.8.0以上才可用)

     2、复合类型
       arrays:ARRAY<data_type>
       maps:MAP<primitive_type,data_type>
       structs:STRUCT<col_name:data_type[COMMENT col_comment],.....>
       union:UNIONTYPE<data_type,data_type,...>

     3、时间戳
       支持传统的unix时间戳,可选的纳秒级精度。
       支持的转换:
          1)整型数值类型:解读为以秒为单位的UNIX时间戳
          2)浮动点数值类型:解读为以秒和小数精度为单位的UNIX时间戳。
          3)字符串:JDBC兼容的java.sql.Timestamp格式“YYYY-MM-DD HH:MM:SS.fffffffff”(9位小数位精度)
       注意:
          1)Dates类型在 Hive 0.12.0 版本中引入了。
          2)Decimal类型在 Hive 0.11.0 版本中引入了,并在 Hive 0.13.0 版本修订了。

     4、Union类型
        Union类型可以在同一时间点,保持恰好有一个指定的数据类型。

     5、常量
        数值类型默认是int,如果数值超出int的范围,就会被解释为bigint。
        数值后面加上后缀表示:

Type 后缀示例
TINYINT Y  100Y
SMALLINT S 100S
BIGINT  L    100L


     6、字符串类型
        字符串可以用单引号或双引号。
        注意:
        1)Varchar类型在 Hive 0.12.0 版本中引入了。
        2)Char类型将在 Hive 0.13.0 版本中引入。

     7、浮点类型
        浮点类型数值,默认为双浮点类型,目前不支持科学计数法。

     8、NULL值
        遗漏的值被代表为特殊值NULL。 要导入NULL字段的数据,需要查阅使用的SerDe的文档。 (默认的文本格式使用LazySimpleSerDe的解释字符串 N为NULL)

免责声明:文章转载自《Hive基础之Hive数据类型》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇python pandas 对带时间序列的数据进行重采样处理Win7 64位系统上配置使用32位的Eclipse(转)下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Hive 学习笔记(启动方式,内置服务)

一、Hive介绍   Hive是基于Hadoop的一个数据仓库,Hive能够将SQL语句转化为MapReduce任务进行运行。   Hive架构图分为以下四部分。       1、用户接口     Hive有三个用户接口: 命令行接口(CLI):以命令行的形式输入SQL语句进行数据数据操作 Web界面:通过Web方式进行访问。      Hive的远程服...

python基础学习4-函数、内置函数、os模块、time模块

  1       函数 1.1     字符串格式化方法 Python中字符串格式化输出的几种方法: https://www.cnblogs.com/hongzejun/p/7670923.html 字符串格式化另外一种方式format方式 #字符串format()方法 #第一种import datetime msg = '欢迎光临{name},今天的日...

JAVA中java.util.Date、java.sql.Timestamp和String之间的互相转换

感谢博主分享 https://www.cnblogs.com/zhang-yan/p/7733005.html java.util.Date---->String /** * 将java.util.Date对象转化为String字符串 * @param date * 要格式的java.util.Date对象 * @par...

使用VS2008开发OPC客户端程序

使用Rockwell的 RsiOPCAuto.dll 或者Siemens的 Interop.OPCSiemensDAAutomation.dll时, 若直接拷贝的Dll使用,需要注册后才可添加引用到VS2008.注册:D:\>regsvr32 rsiopcauto.dll 已下为OPC读取标签的核心内容: 使用了Hash表存储标签位置对应标签多代表...

Python脚本收集腾讯云CDN日志,并入ELK日志分析

负责搭建公司日志分析,一直想把CDN日志也放入到日志分析,前些日志终于达成所愿,现在贴出具体做法: 1、收集日志   腾讯云CDN日志一般一小时刷新一次,也就是说当前只能下载一小时之前的日志数据,但据本人观察,有时前一小时的并下载不到,所以为了保险起见,可以下载两小时之前的日志数据。下载日志可以通过腾讯云的API获取日志列表,然后下载。   腾讯云日志下载...

Apache Hudi使用问题汇总(一)

1.如何写入Hudi数据集 通常,你会从源获取部分更新/插入,然后对Hudi数据集执行写入操作。如果从其他标准来源(如Kafka或tailf DFS)中提取数据,那么DeltaStreamer将会非常有用,其提供了一种简单的自我管理解决方案,可将数据写入Hudi。你还可以自己编写代码,使用Spark数据源API从自定义源获取数据,并使用Hudi数据源写入H...