本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
步骤 8 使用蓝图创建工作流程
为了阅读 CloudTrail 日志,了解它们的结构,在数据目录中创建相应的表,我们需要设置一个工作流,其中包含Amazon Glue爬虫、作业、触发器和工作流程。Lake Formation 的蓝图简化了这一过程。
该工作流程会生成任务、爬网程序和触发器,用于发现数据并将其摄入数据湖中。您可以基于其中一个预定义的 Lake Formation 蓝图创建工作流。
-
在Lake Formation 控制台的导航窗格中,选择蓝图,然后选择使用蓝图.
-
在存储库的使用蓝图页面,在蓝图类型,选择Amazon CloudTrail.
-
UN导入来源,请选择一个 CloudTrail 来源和开始日期。
-
UN导入目标,请指定以下参数:
目标数据库 lakeformation_cloudtrail目标存储位置 s3://<yourName>-datalake-cloudtrail数据格式 Parquet -
对于导入频率,选择按需运行.
-
UN导入选项,请指定以下参数:
工作流名称 lakeformationcloudtrailtestIAM 角色 LakeFormationWorkflowRole表格预留 cloudtrailtest注意 必须是小写字母。
-
选择Create,然后等待控制台报告工作流已成功创建。
提示 您是否收到以下错误消息?
User: arn:aws:iam::<account-id>:user/<datalake_administrator_user>is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...如果是这样,请检查您是否已更换
<account-id>在数据湖管理员用户的内联策略中Amazon账号