本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
第 5 步:使用 Amazon Athena 查询受管控表
现在开始查询您使用 Amazon Athena 创建的受管控表。
如果您是第一次在 Athena 中运行查询,则需要配置查询结果位置。有关更多信息,请参阅 。指定查询结果位置.
运行简单查询
-
要运行简单查询,请登录 Athena 控制台https://console.aws.amazon.com/athena/
在美国东部(弗吉尼亚北部)区域为 DataAnalyst1用户。运行以下查询以预览存储在受管控表中的 10 条记录:SELECT * FROM lakeformation_tutorial_amazon_reviews.amazon_reviews_governed LIMIT 10结果如下所示:
运行分析查询
-
运行以下脚本以运行带聚合的分析查询,以模拟实际用例:
SELECT product_category, count(*) as TotalReviews, avg(star_rating) as AverageRating FROM lakeformation_tutorial_amazon_reviews.amazon_reviews_governed GROUP BY product_category此查询返回每个产品类别的评论总数和平均评分。
使用时空旅行运行分析查询
受管控表启用时空旅行-您可以查询上一次的表。
为了在 Athena 中运行时空旅行查询,你需要使用 Athena 引擎版本 2。如果您的工作组仍在使用 Athena 引擎版本 1,请更新您的工作组以使用 Athena 引擎版本 2。
要提交时空旅行查询,请使用
FOR SYSTEM_TIME AS OF在中位于表名称之后的时间戳SELECT语句,如以下示例语法所示:SELECT * FROM database.table FOR SYSTEM_TIME AS OFtimestamptimestamp参数可以是时间戳,也可以是带时区的时间戳。如果未指定,Athena 将该值视为以 UTC 时间表示的时间戳。运行时空旅行查询以检索截至世界标准时间 2021-05-26 08:15:00 的数据:
SELECT product_category, count(*) as TotalReviews, avg(star_rating) as AverageRating FROM lakeformation_tutorial_amazon_reviews.amazon_reviews_governed FOR SYSTEM_TIME AS OF TIMESTAMP '2021-05-26 08:15:00 UTC' GROUP BY product_category这些区域有:结果屏幕包含以下内容的记录
product_category=Camera. 这是因为该文件在product_category=Books是在时间戳之后添加的 (2021-05-26 世界标准时间 08:15:00),已在中指定FOR SYSTEM_TIME AS OF.