本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
StartMedicalStreamTranscription
并非所有地区都支持Amazon Transcribe 医疗服务。
启动双向 HTTP/2 或 WebSocket 流式传输到 Amazon Transcribe Medical,并且转录结果将流式传输到您的应用程序。
有关使用亚马逊 Transcribe Medical 进行直播的更多信息,请参阅转录流音频.
请求语法
POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"AudioStream": {
"AudioEvent": {
"AudioChunk": blob
}
}
}
URI 请求参数
请求使用以下 URI 参数。
- ContentIdentificationType
-
(PHI),其中标识到您的成绩单中标识的所有个人健康信息 (PHI):
内容识别在片段级别执行;音频片段完全转录后会标记 PHI。
有关更多信息,请参阅 。识别转录中的个人健康信息 (PHI).
有效值:
PHI - EnableChannelIdentification
-
在多声道音频中启用频道识别。
频道标识会单独转录每个通道上的音频,然后将每个通道的输出附加到一个脚本中。
如果您有多声道音频但未启用频道识别,则您的音频将以连续的方式转录,并且您的成绩单不会按频道分隔。
你不能设置
ShowSpeakerLabel和EnableChannelIdentification在同一请求中。如果两者都设置,则请求将返回BadRequestException.有关更多信息,请参阅 。转录多声道音频.
- LanguageCode
-
指定表示音频中所说语言的语言代码。
重要 Amazon Transcribe e Medical 仅支持美式英语 (
en-US)。有效值:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN:是
- MediaEncoding
-
指定用于输入音频的编码。支持的格式为:
-
FLAC
-
Ogg 容器中的 Opus 编码音频
-
PCM(仅有符号的 16 位小端音频格式,不包括 WAV)
有关更多信息,请参阅 。媒体格式.
有效值:
pcm | ogg-opus | flac:是
-
- MediaSampleRateHertz
-
输入音频的采样率(以 Hz 为单位)。Amazon Transcribe e Medical 支持从 16,000 Hz 到 48,000 Hz 的频率范围。请注意,您指定的采样率必须与音频的采样率相匹配。
有效范围:最小值为 8000。最大值为 48000。
:是
- NumberOfChannels
-
指定您的音频流式传输到您的音频流式传输到您的音频中。最多支持两个通道。
有效范围:最小值为 2。
- SessionId
-
为您的转录会话指定一个名称。如果您未在请求中包含此参数,Amazon Transcribe Medical,并且转录到响应中返回该代码。
您可以使用会话 ID 重试流式传输会话。
长度约束:固定长度为 36。
模式:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12} - ShowSpeakerLabel
-
在转录输出中启用说话人识别(二值化)。扬声器标识会在媒体文件中标记单个扬声器的语音。
有关更多信息,请参阅 。识别发言人(日记化).
- Specialty
-
指定音频中包含的医学专业。
有效值:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY:是
- Type
-
指定输入音频的类型。例如,选择
DICTATION对于提供者口述患者记录和CONVERSATION在病人和医疗专业人员之间进行对话。有效值:
CONVERSATION | DICTATION:是
- VocabularyName
-
指定在处理转录时要使用的自定义词汇表的名称。请注意,词汇名称区分大小写。
长度约束:最小长度为 1。最大长度为 200。
模式:
^[0-9a-zA-Z._-]+
请求正文
请求接受采用 JSON 格式的以下数据。
- AudioStream
-
音频 blob 的编码流。音频流编码为 HTTP/2 或 WebSocket 数据帧。
有关更多信息,请参阅 。转录流音频.
类型:AudioStream 对象
:是
响应语法
HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"TranscriptResultStream": {
"BadRequestException": {
},
"ConflictException": {
},
"InternalFailureException": {
},
"LimitExceededException": {
},
"ServiceUnavailableException": {
},
"TranscriptEvent": {
"Transcript": {
"Results": [
{
"Alternatives": [
{
"Entities": [
{
"Category": "string",
"Confidence": number,
"Content": "string",
"EndTime": number,
"StartTime": number
}
],
"Items": [
{
"Confidence": number,
"Content": "string",
"EndTime": number,
"Speaker": "string",
"StartTime": number,
"Type": "string"
}
],
"Transcript": "string"
}
],
"ChannelId": "string",
"EndTime": number,
"IsPartial": boolean,
"ResultId": "string",
"StartTime": number
}
]
}
}
}
}
响应元素
如果此操作成功,则该服务将会发送回 HTTP 200 响应。
响应将返回以下 HTTP 标头。
- ContentIdentificationType
-
显示是否为您的转录启用了内容标识。
有效值:
PHI - EnableChannelIdentification
-
显示是否为转录启用了频道标识。
- LanguageCode
-
提供您在请求中指定的语言代码。必须是
en-US。有效值:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN - MediaEncoding
-
提供您在请求中指定的媒体编码。
有效值:
pcm | ogg-opus | flac - MediaSampleRateHertz
-
提供您在请求中指定的采样率。
有效范围:最小值为 8000。最大值为 48000。
- NumberOfChannels
-
提供您在请求中指定的通道数量。
有效范围:最小值为 2。
- RequestId
-
提供流式请求的标识符。
- SessionId
-
提供转录会话的标识符。
长度约束:固定长度为 36。
模式:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12} - ShowSpeakerLabel
-
显示是否为您的转录启用了说话人识别。
- Specialty
-
提供您在请求中指定的医学专业。
有效值:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY - Type
-
提供您在请求中指定的音频类型。
有效值:
CONVERSATION | DICTATION - VocabularyName
-
提供您在请求中指定的自定义词汇表的名称。
长度约束:最小长度为 1。最大长度为 200。
模式:
^[0-9a-zA-Z._-]+
服务以 JSON 格式返回的以下数据。
- TranscriptResultStream
-
提供有关流式传输到您的流式传输到您的流式传输到您的
错误
有关所有操作常见错误的信息,请参阅常见错误.
- BadRequestException
-
一个或多个参数
StartStreamTranscription要么StartMedicalStreamTranscription操作无效。例如,MediaEncoding要么LanguageCode使用了无效的值。检查指定的参数并再次尝试您的请求。HTTP 状态代码:400
- ConflictException
-
新流以相同的会话 ID 启动。当前流式传输到终止。
HTTP 状态代码:409
- InternalFailureException
-
处理音频时出现问题。Amazon Transcribe 已终止处理。
HTTP 状态代码:500
- LimitExceededException
-
您的客户已超出Amazon Transcribe 限制之一。这通常是音频长度限制。将您的音频将流式传输到较小块,然后重试请求。
HTTP 状态代码:429
- ServiceUnavailableException
-
该服务目前不可用。稍后尝试您的请求。
HTTP 状态代码:503
另请参阅
有关在特定语言的 Amazon 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: