本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Amazon Mechanical Turk 人力
Amazon Mechanical Turk(Mechanical Turk)人力可为您提供最多的工作人员Amazon SageMaker Ground Truth标记作业和Amazon Augmented AI人工审查任务。Amazon Mechanical Turk 人力是世界范围内的资源。工作人员每周 7 天、每天 24 小时提供服务。当您使用 Amazon Mechanical Turk 人力时,通常会为您的人工审核任务和标记作业获得最快的周转时间。
任何 Amazon Mechanical Turk 人力账单都将作为您的 Ground Truth 或亚马逊 Augmented AI 账单的一部分处理。您不需要创建单独的 Mechanical Turk 账户即可使用 Amazon Mechanical Turk 人力。
您不应与此人力共享机密信息、个人信息或受保护的健康信息。当您结合使用亚马逊 A2I 时,不应使用 Amazon Mechanical Turk 员Amazon适用于包含受保护健康信息的工作负载,例如 Amazon Textract 和 Amazon Rekognition。
当您创建 Ground Truth 标签作业或 Amazon A2I 人工审核工作流程(流程定义)时,您可以选择 Mechanical Turk 作为员工。您可以使用 SageMaker 控制台和 API 创建标记作业和人工审核工作流。
当您使用 API 操作创建贴标作业或人工审核工作流程时,您将以下 ARN 用于 Amazon Mechanical Turk 员工WorkteamArn. Replace使用Amazon您用来创建标签作业或人工循环的区域。例如,如果您在美国西部(俄勒冈)创建标记作业,请替换region和regionus-west-2.
-
arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default
Ground Truth 和 Amazon A2I要求当您使用 Mechanical Turk 时,您的输入数据没有个人身份信息 (PII)。如果您使用 Mechanical Turk 工作人员并且没有指定输入数据不含 PII,那么您的 Ground Truth 标签作业和 Augmented AI 任务将失败。当您创建 Ground Truth 标签作业以及使用内置集成或创建 Amazon A2I 人类循环时,您可以指定输入数据不含 PIIStartHumanLoopoperation.
使用以下几节可了解如何在这些服务中使用 Mechanical Turk。
使用 Mechanical Turk 与 Ground Truth
当您使用控制台创建标记作业时,您可以使用 Mechanical Turk 和 GGround Truth TurkCreateLabelingJoboperation.
当您创建标记作业时,我们建议您根据作业的复杂性和您需要的质量,调整对每个数据对象进行注释的工作人员数量。Amazon SageMaker Ground Truth 使用注释整合来提高标签的质量。对于较为复杂的标记作业,工作人员数量较多会给标签质量带来帮助,但对于比较简单的作业则没多大作用。有关更多信息,请参阅 合并注释。请注意,Amazon A2I 人工审核工作流程不支持注释整合。
要在您创建标记作业(控制台)时使用 Mechanical Turk:
-
使用以下命令可以使用 SageMaker 控制台的 Ground Truth 区域创建标记作业:创建标记作业(控制台).
-
当你选择工作程类型中的人力部分,选择Amazon Mechanical Turk.
-
使用指定工作人员完成任务所需的总时间任务超时.
-
指定任务可供工作人员使用的总时间任务过期. 这就是工作人员在任务失败之前必须拿起多长时间。
-
选择每项任务的价格使用下拉列表。这是工作人员完成单项任务所获得的金额。
-
(可选)如果适用,请选择数据集不包含成人内容。 如果包含成人内容,则 SageMaker 可能会限制可以查看您的任务的 Mechanical Turk 工作人员。
-
您必须阅读并确认以下声明,方法是选中复选框才能使用 Mechanical Turk 工作人员。如果您的输入数据包含机密信息、个人信息或受保护的健康信息,您必须选择其他人力。
您了解并同意,Mechanical Turk 人力由位于世界各地的独立承包商组成,您不应与此人力共享机密信息、个人信息或受保护的健康信息。
-
(可选)选中旁边的复选框启用自动化数据标签如果您想启用自动数据标记功能。要了解有关此功能的更多信息,请参自动数据标记.
-
您可以指定每个数据集对象的工作人员数下其他配置. 例如,如果在此字段中输入 3,则每个数据对象将由 3 个工作人员标记。
当你通过选择创建标签作业时Create,您的标签任务将发送给 Mechanical Turk 员。
要在您创建标记作业 (API) 时使用 Mechanical Turk:
-
使用以下命令创建标记作业:
CreateLabelingJob操作:创建标记作业 (API). -
对使用以下命令
WorkteamArn. Replace使用Amazon您用来创建标签作业的区域。regionarn:aws:sagemaker:region:394669845002:workteam/public-crowd/default -
使用
TaskTimeLimitInSeconds以指定工作人员完成任务所需的总时间。 -
使用
TaskAvailabilityLifetimeInSeconds以指定任务可供工作人员使用的总时间。这就是工作人员在任务失败之前必须拿起多长时间。 -
使用
NumberOfHumanWorkersPerDataObject以指定每个数据集对象的工作人员数量。 -
使用
PublicWorkforceTaskPrice来设置每个任务的价格。这是工作人员完成单项任务所获得的金额。 -
使用
DataAttributes以指定您的输入数据不包含机密信息、个人信息或受保护的健康信息。Ground Truth要求如果您使用 Mechanical Turk 工作人员,则输入数据不含个人身份信息 (PII)。如果您使用 Mechanical Turk 并且没有指定输入数据不含 PII,请使用
FreeOfPersonallyIdentifiableInformation标记,你的标签作业将失败。使用
FreeOfAdultContent标记以声明您的输入数据不含成人内容。 如果包含成人内容,则 SageMaker 可能会限制可以查看您的任务的 Mechanical Turk 工作人员。
您可以在 GitHub 上找到的以下笔记本中看到如何使用此 API 的示例:Ground Truth Jupyter 笔记本示例
对使用 Amazon A2I 使用 Mechanical Turk
在创建人工审核工作流程时,您可以指定要将 Mechanical Turk 与 Amazon A2I 结合使用,也称为流定义、在控制台中或使用CreateFlowDefinitionAPI 操作。当您使用此人工审核工作流程配置人工循环时,必须指定输入数据不含 PII。
要在您创建人工审核工作流程(控制台)时使用 Mechanical Turk:
-
使用以下命令在 SageMaker 控制台的 Augmented AI 部分创建人工审核工作流程:创建人工审核工作流程(控制台).
-
当你选择工作程类型中的人力部分,选择Amazon Mechanical Turk.
-
选择每项任务的价格使用下拉列表。这是工作人员完成单项任务所获得的金额。
-
(可选)您可以指定每个数据集对象的工作人员数下其他配置. 例如,如果在此字段中输入 3,则每个数据对象将由 3 个工作人员标记。
-
(可选)指定工作人员完成任务所需的总时间任务超时.
-
(可选)指定任务可供工作人员使用的总时间任务过期. 这就是工作人员在任务失败之前必须拿起多长时间。
-
创建人工审核工作流程后,您可以通过在参数中提供人工循环来配置人工循环,方法是在参数中提供其亚马逊资源名称 (ARN)
FlowDefinitionArn. 您可以使用内置任务类型的 API 操作之一或 Amazon A2I 运行时 API 操作来配置人工循环,StartHumanLoop. 要了解更多信息,请参阅 创建和启动人工循环。配置人类循环时,必须使用
FreeOfPersonallyIdentifiableInformation中的内容分类器DataAttributes. 如果您使用 Mechanical Turk 并且没有指定输入数据不含 PII,那么您的人工审核任务将失败。使用
FreeOfAdultContent标记以声明您的输入数据不含成人内容。 如果包含成人内容,则 SageMaker 可能会限制可以查看您的任务的 Mechanical Turk 工作人员。
要在您创建人工审核工作流程 (API) 时使用 Mechanical Turk:
-
使用以下命令创建人工审核工作流程
CreateFlowDefinition操作:创建人工审核工作流程 (API). -
对使用以下命令
WorkteamArn. Replace使用Amazon您用来创建标签作业的区域。regionarn:aws:sagemaker:region:394669845002:workteam/public-crowd/default -
使用
TaskTimeLimitInSeconds以指定工作人员完成任务所需的总时间。 -
使用
TaskAvailabilityLifetimeInSeconds以指定任务可供工作人员使用的总时间。这就是工作人员在任务失败之前必须拿起多长时间。 -
使用
TaskCount以指定每个数据集对象的工作人员数量。例如,如果为此参数指定 3,则每个数据对象将由 3 个工作器标记。 -
使用
PublicWorkforceTaskPrice来设置每个任务的价格。这是工作人员完成单项任务所获得的金额。 -
创建人工审核工作流程后,您可以通过在参数中提供人工循环来配置人工循环,方法是在参数中提供其亚马逊资源名称 (ARN)
FlowDefinitionArn. 您可以使用内置任务类型的 API 操作之一或 Amazon A2I 运行时 API 操作来配置人工循环,StartHumanLoop. 要了解更多信息,请参阅 创建和启动人工循环。配置人类循环时,必须使用
FreeOfPersonallyIdentifiableInformation中的内容分类器DataAttributes. 如果您使用 Mechanical Turk 并且没有指定输入数据不含 PII,那么您的人工审核任务将失败。使用
FreeOfAdultContent标记以声明您的输入数据不含成人内容。 如果包含成人内容,则 SageMaker 可能会限制可以查看您的任务的 Mechanical Turk 工作人员。
您可以在 GitHub 上找到的以下笔记本中看到如何使用此 API 的示例:Amazon A2I Jupyter 笔记本电脑示例
什么时候不支持 Mechanical Turk?
在以下情况下,该员工不受支持。在每种情况下,都必须使用私人的要么供应商人力。
-
Ground Truth 视频帧标记作业和 3D 点云标记作业不支持此人力。
-
如果您的输入数据包含个人身份信息 (PII),则无法使用此人力。
-
Mechanical Turk 在某些Amazon特殊区域。如果适用,请参阅您的特殊区域的文档以了解更多信息。