StartMedicalStreamTranscription - 转录
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

StartMedicalStreamTranscription

注意

并非所有地区都支持Amazon Transcribe 医疗服务。

启动双向 HTTP/2 或 WebSocket 流式传输到 Amazon Transcribe Medical,并且转录结果将流式传输到您的应用程序。

有关使用亚马逊 Transcribe Medical 进行直播的更多信息,请参阅转录流音频.

请求语法

POST /medical-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

URI 请求参数

请求使用以下 URI 参数。

ContentIdentificationType

(PHI),其中标识到您的成绩单中标识的所有个人健康信息 (PHI):

内容识别在片段级别执行;音频片段完全转录后会标记 PHI。

有关更多信息,请参阅 。识别转录中的个人健康信息 (PHI).

有效值: PHI

EnableChannelIdentification

在多声道音频中启用频道识别。

频道标识会单独转录每个通道上的音频,然后将每个通道的输出附加到一个脚本中。

如果您有多声道音频但未启用频道识别,则您的音频将以连续的方式转录,并且您的成绩单不会按频道分隔。

你不能设置ShowSpeakerLabelEnableChannelIdentification在同一请求中。如果两者都设置,则请求将返回BadRequestException.

有关更多信息,请参阅 。转录多声道音频.

LanguageCode

指定表示音频中所说语言的语言代码。

重要

Amazon Transcribe e Medical 仅支持美式英语 (en-US)。

有效值: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN

:是

MediaEncoding

指定用于输入音频的编码。支持的格式为:

  • FLAC

  • Ogg 容器中的 Opus 编码音频

  • PCM(仅有符号的 16 位小端音频格式,不包括 WAV)

有关更多信息,请参阅 。媒体格式.

有效值: pcm | ogg-opus | flac

:是

MediaSampleRateHertz

输入音频的采样率(以 Hz 为单位)。Amazon Transcribe e Medical 支持从 16,000 Hz 到 48,000 Hz 的频率范围。请注意,您指定的采样率必须与音频的采样率相匹配。

有效范围:最小值为 8000。最大值为 48000。

:是

NumberOfChannels

指定您的音频流式传输到您的音频流式传输到您的音频中。最多支持两个通道。

有效范围:最小值为 2。

SessionId

为您的转录会话指定一个名称。如果您未在请求中包含此参数,Amazon Transcribe Medical,并且转录到响应中返回该代码。

您可以使用会话 ID 重试流式传输会话。

长度约束:固定长度为 36。

模式:[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

在转录输出中启用说话人识别(二值化)。扬声器标识会在媒体文件中标记单个扬声器的语音。

有关更多信息,请参阅 。识别发言人(日记化).

Specialty

指定音频中包含的医学专业。

有效值: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

:是

Type

指定输入音频的类型。例如,选择DICTATION对于提供者口述患者记录和CONVERSATION在病人和医疗专业人员之间进行对话。

有效值: CONVERSATION | DICTATION

:是

VocabularyName

指定在处理转录时要使用的自定义词汇表的名称。请注意,词汇名称区分大小写。

长度约束:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

请求正文

请求接受采用 JSON 格式的以下数据。

AudioStream

音频 blob 的编码流。音频流编码为 HTTP/2 或 WebSocket 数据帧。

有关更多信息,请参阅 。转录流音频.

类型:AudioStream 对象

:是

响应语法

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "StartTime": number, "Type": "string" } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "ResultId": "string", "StartTime": number } ] } } } }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

响应将返回以下 HTTP 标头。

ContentIdentificationType

显示是否为您的转录启用了内容标识。

有效值: PHI

EnableChannelIdentification

显示是否为转录启用了频道标识。

LanguageCode

提供您在请求中指定的语言代码。必须是 en-US

有效值: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN

MediaEncoding

提供您在请求中指定的媒体编码。

有效值: pcm | ogg-opus | flac

MediaSampleRateHertz

提供您在请求中指定的采样率。

有效范围:最小值为 8000。最大值为 48000。

NumberOfChannels

提供您在请求中指定的通道数量。

有效范围:最小值为 2。

RequestId

提供流式请求的标识符。

SessionId

提供转录会话的标识符。

长度约束:固定长度为 36。

模式:[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

显示是否为您的转录启用了说话人识别。

Specialty

提供您在请求中指定的医学专业。

有效值: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Type

提供您在请求中指定的音频类型。

有效值: CONVERSATION | DICTATION

VocabularyName

提供您在请求中指定的自定义词汇表的名称。

长度约束:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

服务以 JSON 格式返回的以下数据。

TranscriptResultStream

提供有关流式传输到您的流式传输到您的流式传输到您的

类型:MedicalTranscriptResultStream 对象

错误

有关所有操作常见错误的信息,请参阅常见错误.

BadRequestException

一个或多个参数StartStreamTranscription要么StartMedicalStreamTranscription操作无效。例如,MediaEncoding要么LanguageCode使用了无效的值。检查指定的参数并再次尝试您的请求。

HTTP 状态代码:400

ConflictException

新流以相同的会话 ID 启动。当前流式传输到终止。

HTTP 状态代码:409

InternalFailureException

处理音频时出现问题。Amazon Transcribe 已终止处理。

HTTP 状态代码:500

LimitExceededException

您的客户已超出Amazon Transcribe 限制之一。这通常是音频长度限制。将您的音频将流式传输到较小块,然后重试请求。

HTTP 状态代码:429

ServiceUnavailableException

该服务目前不可用。稍后尝试您的请求。

HTTP 状态代码:503

另请参阅

有关在特定语言的 Amazon 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: