CreateLanguageModel - 转录
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CreateLanguageModel

注意

并非所有区域都支持自定义语言模型。

创建新的自定义语言模型。

创建新的自定义语言模型时,您必须指定:

  • 如果你想要宽带(音频采样率超过 16,000 Hz)或窄带(音频采样率低于 16,000 Hz)基本型号

  • 训练和调整文件的位置(必须是 Amazon S3)位置

  • 你的模型的语言

  • 模型的独特名称

请求语法

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "Tags": [ { "Key": "string", "Value": "string" } ] }

请求参数

有关所有操作的通用参数的信息,请参阅常见参数.

请求接受采用 JSON 格式的以下数据。

BaseModelName

用于创建自定义语言模型的 Amazon Transcribe 标准语言模型或基本模型。Amazon Transcribe 为基本型号提供两种选择:宽带和窄带。

如果您要转录的音频采样率为 16,000 Hz 或更高,请选择WideBand. 要转录采样率低于 16,000 Hz 的音频,请选择NarrowBand.

类型: 字符串

有效值: NarrowBand | WideBand

必需:是

InputDataConfig

包含要用于创建新的自定义语言模型的训练数据的 Amazon S3 位置,以及访问该位置的权限。

使用InputDataConfig,则必须包括以下子参数:S3Uri,这是训练数据的 Simple Service(Amazon S3)位置,以及DataAccessRoleArn,这是角色的 Amazon 资源名称 (ARN)。您可以选择性地包含TuningDataS3Uri,这是调整数据的 Amazon S3 Storage S3)位置。如果您为训练和调整数据指定了不同的 Amazon S3 位置,则您使用的 ARN 必须具有访问这两个位置的权限。

类型:InputDataConfig 对象

必需:是

LanguageCode

表示模型语言的语言代码。每个自定义语言模型只能包含一种语言的术语,并且您为自定义语言模型选择的语言必须与训练和调整数据的语言相匹配。

有关受支持的语言的列表,请参阅支持的语言表。请注意,美式英语 (en-US) 是Amazon Transcribe 医疗支持的唯一语言。

自定义语言模型只能用于转录与模型使用相同语言的文件。例如,如果您使用美式英语创建自定义语言模型 (en-US),则只能将此模型应用于包含英语音频的文件。

类型: 字符串

有效值: en-US | hi-IN | es-US | en-GB | en-AU

必需:是

ModelName

由您为自定义语言模型选择的唯一名称。

此名称区分大小写,不能包含空格,并且在Amazon Web Services 账户. 如果您尝试创建与现有自定义语言模型同名的新自定义语言模型,则会获得ConflictException错误消息。

类型: 字符串

长度约束:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

必需:是

Tags

在创建此新模型时,向新的自定义语言模型添加一个或多个自定义标签,每个标签均采用 key: value 对的形式。

要了解有关使用 Amazon Transcribe 中标签的更多信息,请参阅为资源添加标签.

类型: 数组Tag对象

数组成员:最少 1 项。最多 200 项。

必需:否

响应语法

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "ModelStatus": "string" }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

服务以 JSON 格式返回的以下数据。

BaseModelName

您在创建自定义语言模型时指定的 Amazon Transcribe 标准语言模型或基本模型。

类型: 字符串

有效值: NarrowBand | WideBand

InputDataConfig

列出您的数据访问角色 ARN(亚马逊资源名称)和您为培训提供的 Amazon S3 位置 (S3Uri) 和调整 (TuningDataS3Uri)DATA。

类型:InputDataConfig 对象

LanguageCode

您为自定义语言模型选择的语言代码。

类型: 字符串

有效值: en-US | hi-IN | es-US | en-GB | en-AU

ModelName

您的自定义语言模型的名称。

类型: 字符串

长度约束:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

ModelStatus

您的自定义语言模型的状态。当状态显示为COMPLETED,模型已准备就绪,可供使用。

类型: 字符串

有效值: IN_PROGRESS | FAILED | COMPLETED

错误

有关所有操作常见错误的信息,请参阅常见错误.

BadRequestException

您的请求未通过一个或多个验证测试。当您尝试删除的实体不存在或处于非终端状态(例如IN PROGRESS)。有关更多信息,请参阅 “异常消息” 字段。

HTP 状态代码:400

ConflictException

已存在具有此名称的资源。资源名称必须唯一Amazon Web Services 账户.

HTP 状态代码:400

InternalFailureException

发生内部服务器错误。检查错误消息并纠正问题,然后再次尝试请求。

HTP 状态代码:500

LimitExceededException

您已经发送过多的请求或您的输入文件太长。等待,然后再重试请求,或使用较小的文件,然后再次尝试请求。

HTP 状态代码:400

另请参阅

有关在特定语言的 Amazon 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: