第 5 步:使用 Amazon Athena 查询受管控表 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第 5 步:使用 Amazon Athena 查询受管控表

现在开始查询您使用 Amazon Athena 创建的受管控表。

如果您是第一次在 Athena 中运行查询,则需要配置查询结果位置。有关更多信息,请参阅 。指定查询结果位置.

运行简单查询

  • 要运行简单查询,请登录 Athena 控制台https://console.aws.amazon.com/athena/在美国东部(弗吉尼亚北部)区域为DataAnalyst1用户。运行以下查询以预览存储在受管控表中的 10 条记录:

    SELECT * FROM lakeformation_tutorial_amazon_reviews.amazon_reviews_governed LIMIT 10

    结果如下所示:

运行分析查询

  • 运行以下脚本以运行带聚合的分析查询,以模拟实际用例:

    SELECT product_category, count(*) as TotalReviews, avg(star_rating) as AverageRating FROM lakeformation_tutorial_amazon_reviews.amazon_reviews_governed GROUP BY product_category

    此查询返回每个产品类别的评论总数和平均评分。

使用时空旅行运行分析查询

受管控表启用时空旅行-您可以查询上一次的表。

注意

为了在 Athena 中运行时空旅行查询,你需要使用 Athena 引擎版本 2。如果您的工作组仍在使用 Athena 引擎版本 1,请更新您的工作组以使用 Athena 引擎版本 2。

  • 要提交时空旅行查询,请使用FOR SYSTEM_TIME AS OF在中位于表名称之后的时间戳SELECT语句,如以下示例语法所示:

    SELECT * FROM database.table FOR SYSTEM_TIME AS OF timestamp

    timestamp参数可以是时间戳,也可以是带时区的时间戳。如果未指定,Athena 将该值视为以 UTC 时间表示的时间戳。运行时空旅行查询以检索截至世界标准时间 2021-05-26 08:15:00 的数据:

    SELECT product_category, count(*) as TotalReviews, avg(star_rating) as AverageRating FROM lakeformation_tutorial_amazon_reviews.amazon_reviews_governed FOR SYSTEM_TIME AS OF TIMESTAMP '2021-05-26 08:15:00 UTC' GROUP BY product_category

    这些区域有:结果屏幕包含以下内容的记录product_category=Camera. 这是因为该文件在product_category=Books是在时间戳之后添加的 (2021-05-26 世界标准时间 08:15:00),已在中指定FOR SYSTEM_TIME AS OF.