本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
CreateVocabularyFilter
创建新的自定义词汇过滤器。
您可以使用自定义词汇过滤器来掩盖、删除或标记成绩单中的特定单词。自定义词汇过滤器通常用于掩盖成绩单中的亵渎内容。
每种语言都有一个字符集,其中包含该特定语言允许使用的所有字符。如果您使用不支持的字符,您的自定义词汇过滤器请求将失败。请参阅自定义词汇表的字符集的条目,获取适用于您的语言的字符集。
有关更多信息,请参阅 。词汇表筛选.
请求语法
{
"LanguageCode": "string",
"Tags": [
{
"Key": "string",
"Value": "string"
}
],
"VocabularyFilterFileUri": "string",
"VocabularyFilterName": "string",
"Words": [ "string" ]
}
请求参数
有关所有操作的通用参数的信息,请参阅常见参数.
请求接受采用 JSON 格式的以下数据。
- LanguageCode
-
表示词汇过滤器中条目的语言的语言代码。每个自定义词汇过滤器只能包含一种语言的术语。
自定义词汇过滤器只能用于转录与过滤器使用相同语言的文件。例如,如果您使用美式英语创建自定义词汇过滤器 (
en-US),则只能将此过滤器应用于包含英语音频的文件。有关受支持的语言及其相关语言代码的列表,请参阅支持的语言表。
类型: 字符串
有效值:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ:是
- Tags
-
在创建此新词汇过滤器时,将一个或多个自定义标签(每个标签以 key: value 对的形式)添加到新的自定义词汇过滤器中。
要了解有关使用 Amazon Transcribe 中标签的更多信息,请参阅为资源添加标签.
类型: 的数组Tag对象
数组成员:最少 1 项。最多 200 项。
:否
- VocabularyFilterFileUri
-
包含自定义词汇筛选条件的文本文件的 Amazon S3 位置。URI 必须位于同一中Amazon Web Services 区域作为你调用的资源。
以下是示例URI 路径:
s3://DOC-EXAMPLE-BUCKET/my-vocab-filter-file.txt请注意,如果你包含
VocabularyFilterFileUri在您的请求中,您无法使用Words;必须从中选择一项。类型: 字符串
长度约束:最小长度为 1。长度上限为 2000。
模式:
(s3://|http(s*)://).+:否
- VocabularyFilterName
-
您为新的自定义词汇过滤器选择的唯一名称。
此名称区分大小写,不能包含空格,并且在Amazon Web Services 账户. 如果你尝试创建一个与现有自定义词汇过滤器同名的新自定义词汇过滤器,你会得到一个
ConflictException错误消息。类型: 字符串
长度约束:最小长度为 1。最大长度为 200。
模式:
^[0-9a-zA-Z._-]+:是
- Words
-
如果您希望通过在请求中以逗号分隔值包含所有所需术语来创建自定义词汇过滤器,请使用此参数。创建词汇筛选条件的另一个选项是将您的条目保存在文本文件中并将其上传到 Amazon S3 存储桶,然后使用
VocabularyFilterFileUri参数。请注意,如果你包含
Words在您的请求中,您无法使用VocabularyFilterFileUri;必须从中选择一项。每种语言都有一个字符集,其中包含该特定语言允许使用的所有字符。如果您使用不支持的字符,您的自定义词汇过滤器请求将失败。请参阅自定义词汇表的字符集的条目,获取适用于您的语言的字符集。
类型: 字符串数组
数组成员:最少 1 项。
长度约束:最小长度为 1。长度上限为 256。
:否
响应语法
{
"LanguageCode": "string",
"LastModifiedTime": number,
"VocabularyFilterName": "string"
}
响应元素
如果此操作成功,则该服务将会发送回 HTTP 200 响应。
服务以 JSON 格式返回的以下数据。
- LanguageCode
-
您为自定义词汇过滤器选择的语言代码。
类型: 字符串
有效值:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ - LastModifiedTime
-
您创建自定义词汇过滤器的日期和时间。
时间戳的格式为
YYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC. 例如,2022-05-04T12:32:58.761000-07:00代表 2022 年 5 月 4 日下午 12:32。UTC-7类型: 时间戳
- VocabularyFilterName
-
您为自定义词汇过滤器选择的名称。
类型: 字符串
长度约束:最小长度为 1。最大长度为 200。
模式:
^[0-9a-zA-Z._-]+
错误
有关所有操作常见错误的信息,请参阅常见错误.
- BadRequestException
-
您的请求未通过一个或多个验证测试。当您尝试删除的实体不存在或处于非终端状态(例如
IN PROGRESS)。有关更多信息,请参阅 “异常消息” 字段。HTTP 状态代码:400
- ConflictException
-
已存在具有此名称的资源。的资源名称在中必须唯一Amazon Web Services 账户.
HTTP 状态代码:400
- InternalFailureException
-
发生内部服务器错误。检查错误消息并更正问题,然后重试发送您的请求。
HTTP 状态代码:500
- LimitExceededException
-
您已经发送过多的请求或您的输入文件中包含太长。等待,然后再重试发送您的请求,或使用较小的文件,然后重试发送您的请求。
HTTP 状态代码:400
另请参阅
有关在特定语言的 Amazon 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: