本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
步骤 8:使用蓝图创建工作流程
这些区域有:Amazon Lake Formation工作流生成的Amazon Glue作业、爬网程序和触发器,用于发现数据并将其摄取到数据湖中。您可以基于其中一个预定义的 Lake Formation 蓝图创建工作流。
-
在 Lake Formation 控制台的导航窗格中,选择 Lake Form蓝图(容量预留),然后选择使用蓝图.
-
在存储库的使用蓝图页面,在蓝图类型,选择数据库快照.
-
UNDER导入来源,对于数据库连接,选择您刚刚创建的连接,
datalake-tutorial,或者为您的数据源选择一个现有连接。 -
适用于源数据路径,输入要从中提取数据的路径,格式为
.<database>/<schema>/<table>您可以用百分比 (%) 通配符替换 schema 或 table。对于支持模式的数据库,请输入
<database>/<schema>/% 以匹配中的所有表<schema>之内<database>. Oracle Database 和 MySQL 不支持路径中的架构;相反,请输入<database>/%。对于Oracle数据库,<database>是系统标识符 (SID)。例如,如果 Oracle 数据库具有
orcl作为其 SID,请输入orcl/%匹配在 JDCB 连接中指定的用户有权访问的所有表。重要 此字段区分大小写。
-
UNDER导入目标,请指定以下参数:
目标数据库 lakeformation_tutorial目标存储位置 s3://<yourName>-datalake-tutorial数据格式 (选择镶木地板或 CSV) -
对于导入频率,选择按需运行.
-
UNDER导入选项,请指定以下参数:
工作流名称 lakeformationjdbctestIAM 角色 LakeFormationWorkflowRole表prefi jdbctest注意 必须是小写字母。
-
选择Create,然后等待控制台报告工作流已成功创建。
提示 您收到以下错误消息了吗?
User: arn:aws:iam::<account-id>:user/<datalake_administrator_user>is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...如果是这样,请检查您是否已更换
<account-id>在数据湖管理员用户的内联策略中Amazon账号。