步骤 8:使用蓝图创建工作流程 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 8:使用蓝图创建工作流程

这些区域有:Amazon Lake Formation工作流生成的Amazon Glue作业、爬网程序和触发器,用于发现数据并将其摄取到数据湖中。您可以基于其中一个预定义的 Lake Formation 蓝图创建工作流。

  1. 在 Lake Formation 控制台的导航窗格中,选择 Lake Form蓝图(容量预留),然后选择使用蓝图.

  2. 在存储库的使用蓝图页面,在蓝图类型,选择数据库快照.

  3. UNDER导入来源,对于数据库连接,选择您刚刚创建的连接,datalake-tutorial,或者为您的数据源选择一个现有连接。

  4. 适用于源数据路径,输入要从中提取数据的路径,格式为<database>/<schema>/<table>.

    您可以用百分比 (%) 通配符替换 schema 或 table。对于支持模式的数据库,请输入<database>/<schema>/% 以匹配中的所有表<schema>之内<database>. Oracle Database 和 MySQL 不支持路径中的架构;相反,请输入<database>/%。对于Oracle数据库,<database>是系统标识符 (SID)。

    例如,如果 Oracle 数据库具有orcl作为其 SID,请输入orcl/%匹配在 JDCB 连接中指定的用户有权访问的所有表。

    重要

    此字段区分大小写。

  5. UNDER导入目标,请指定以下参数:

    目标数据库 lakeformation_tutorial
    目标存储位置 s3://<yourName>-datalake-tutorial
    数据格式 (选择镶木地板或 CSV)
  6. 对于导入频率,选择按需运行.

  7. UNDER导入选项,请指定以下参数:

    工作流名称 lakeformationjdbctest
    IAM 角色 LakeFormationWorkflowRole
    表prefi jdbctest
    注意

    必须是小写字母。

  8. 选择Create,然后等待控制台报告工作流已成功创建。

    提示

    您收到以下错误消息了吗?

    User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...

    如果是这样,请检查您是否已更换<account-id>在数据湖管理员用户的内联策略中Amazon账号。