Amazon Athena 中的数据类型

运行 CREATE TABLE 时，您可以指定列名和每列可以包含的数据类型。Athena 支持下面列出的数据类型。有关 JDBC 驱动程序在 Athena、JDBC 和 Java 之间支持的数据类型映射的信息，请参阅《JDBC 驱动程序安装和配置指南》中的数据类型一节。有关 ODBC 驱动程序在 Athena 和 SQL 之间支持的数据类型映射的信息，请参阅《ODBC 驱动程序安装和配置指南》中的数据类型一节。

boolean – 值为 true 和 false。
tinyint – 一个 8 位有符号的整数，采用二进制补码格式，最小值为 -2⁷，最大值为 2⁷-1。
smallint – 一个 16 位有符号的整数，采用二进制补码格式，最小值为 -2¹⁵，最大值为 2¹⁵-1。
int 和 integer – Athena 根据查询类型使用不同的整数表达式。
- int – 在数据定义语言 (DDL) 查询（如 CREATE TABLE）中，使用 int 数据类型。
- integer – 在 DML 查询（如 SELECT * FROM）中，使用 integer 数据类型。integer 以二进制补码格式表示为 32 位有符号值，最小值为 -2³¹，最大值为 2³¹-1。
  - 为确保与业务分析应用程序兼容，JDBC 驱动程序返回 integer 类型。
bigint – 一个 64 位有符号的整数，采用二进制补码格式，最小值为 -2⁶³，最大值为 2⁶³-1。
double – 64 位有符号的双精度浮点数。范围为 4.94065645841246544e-324d 至 1.79769313486231570e+308d，正或负。double 遵循 IEEE 浮点算法标准 (IEEE 754)。
float – 32 位有符号的单精度浮点数。范围为 1.40129846432481707e-45 至 3.40282346638528860e+38，正或负。float 遵循 IEEE 浮点算法标准 (IEEE 754)。相当于 Presto 中的 real。在 Athena 中，在 CREATE TABLE 等 DDL 语句中使用 float，在 SELECT CAST 等 SQL 函数中使用 real。Amazon Glue 爬网程序以 float 返回值, Athena 将内部翻译 real 和 float 类型（请参阅 2018 年 6 月 5 日发布说明）。
decimal(precision, scale) – precision 是总位数，而 scale（可选）是小数部分的位数，默认值为 0。例如，使用以下类型定义：decimal(11,5)、decimal(15)。最大精度值为 38，最大标度值为 38。

要将十进制值指定为文字（例如在查询 DDL 表达式中选择具有特定十进制值的行时），请指定 decimal 类型定义，并在查询中将十进制值列为文字（带单引号），如下例所示：decimal_value = decimal '0.12'。
char – 固定长度字符数据，具有介于 1 和 255 之间的指定长度，例如 char(10)。有关更多信息，请参阅 CHAR Hive 数据类型。
注意
要使用 substr 函数从 char 数据类型返回指定长度的子字符串，您必须先将 char 值转换为 varchar，如以下示例所示。
```
substr(cast(col1 as varchar), 1, 4)
```
varchar – 可变长度字符数据，具有介于 1 和 65535 之间的指定长度，例如 varchar(10)。有关更多信息，请参阅 VARCHAR Hive 数据类型。
string – 用单引号或双引号括起的字符串文本。有关更多信息，请参阅 STRING Hive 数据类型。

注意
在 Athena 中，无法将非字符串数据类型强制转换为 string；而是将这些数据类型强制转换为 varchar。
binary – 用于 Parquet 中的数据。
date – ISO 格式的日期，例如 YYYY-MM-DD。例如：date '2008-09-15'。OpenCSVSerDe 是一个例外，它使用自 1970 年 1 月 1 日以来经过的天数。有关更多信息，请参阅用于处理 CSV 的 OpenCSVSerDe。
timestamp – 使用 java.sql.Timestamp 兼容格式的瞬间日期和时间最多可达毫秒级的最大分辨率，例如 yyyy-MM-dd HH:mm:ss[.f...]。例如：timestamp '2008-09-15 03:04:05.324'。OpenCSVSerDe 是一个例外，它使用UNIX 数字格式的 timestamp 数据（例如 1579059880000）。有关更多信息，请参阅用于处理 CSV 的 OpenCSVSerDe。

array<data_type> – 给定组件类型的数组。

示例


CREATE TABLE table array_table (c1 array<integer>) LOCATION '...';
INSERT INTO array_table values(ARRAY[1,2,3]);

map<primitive_type, data_type> – 给定组件类型之间的映射。

示例


CREATE TABLE map_table(c1 map<string, integer>) LOCATION '...';
INSERT INTO map_table values(MAP(ARRAY['foo', 'bar'], ARRAY[1, 2]));

struct<col_name : data_type [comment col_comment] , ...> – 不同组件类型的元素集合。

示例


CREATE TABLE struct_table(c1 struct<name:varchar(10), age:integer>) LOCATION '...';
INSERT INTO struct_table SELECT CAST(ROW('Bob', 38) AS ROW(name VARCHAR(10), age INTEGER));

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

SQL 参考

DML 查询、函数和运算符