受管表的注释和限制 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

受管表的注释和限制

请记住以下受管表的注释和限制:

  • 目前仅Amazon Athena、Amazon Redshift SpectrumAmazon GlueETL 脚本支持查询受管控的表。Athena 查询仅限于只读。

  • 有关从 Amazon Redshift Spectrum 查询Lake Formation 表的信息,请参阅将 Redshift 与结合使用Amazon Lake Formation中的Amazon Redshift 开发人员指南。

  • 对于静态加密的数据,受管控表照常工作,其中Amazon Glue管理加密密钥。与受管表所在的 Amazon S3 位置关联的 IAM 角色需要具有Amazon KMS权限。

  • 启用数据目录元数据加密后,受管控的表可以照常运行。与受管表所在的 Amazon S3 位置关联的 IAM 角色需要具有Amazon KMS权限。此外,您需要向 IAM 角色和 Lake Formation 服务授予加密或解密密密钥的权限。

  • 默认的 Lake Formation SLR 角色不能用于加密的受管控表。您必须在 Amazon S3 中使用自定义 IAM 角色Amazon KMS和 CloudWatch 策略。

  • 使用以下命令创建受管控表Amazon Web Services Management Console,你必须使用 Lake Formation 控制台。您不能使用Amazon Glue控制台。

  • 仅支持包含 Parquet 格式文件的分区表进行数据压缩。

  • 您无法将现有的非管控表转换为受管控表,也不能将现有受管控表转换为不受管控的表。

  • Amazon Glue搜寻器不支持受管控的表。

  • 你不能使用 Apache Spark DataFrames 从受管表中读取以及向其写入数据。

  • 中不支持向下推谓词Amazon GlueETL。

  • 如果您在 30 分钟内主动写入超过 250 个分区,则数据压缩所需的时间可能比平时长。

  • 使用动态框架读取受管控表时,不支持以下功能Amazon GlueETL

  • 以下Amazon Glue不允许在受管控的表上进行 API 操作:

    • CreatePartition

    • BatchCreatePartition

    • UpdatePartition

    • BatchUpdatePartitions

    • DeletePartition

    • BatchDeletePartition

    • GetPartition

    • BatchGetPartition

    这些限制的原因是,必须使用支持事务的 API 操作对受管表执行分区操作。有关更多信息,请参阅受管控的表格对象 API.

    此外,还有一些限制UpdateTableAPI 操作。您无法更新表类型、更改分区键或更改表位置。

  • 在 Amazon S3 中创建受管表清单中的对象并将其添加到受管控表后,它应该被修改。尽管 Amazon S3 允许多次写入一个对象,但 Lake Formation 假设数据湖中的对象只写入一次。

  • Amazon S3 对象一次只能添加到一个受管控的表中。强烈建议将多个活动事务中的同一 Amazon S3 对象添加到多个受管控的表中。