StartMedicalStreamTranscription

注意

并非所有地区都支持Amazon Transcribe 医疗服务。

启动双向 HTTP/2 或 WebSocket 流式传输到 Amazon Transcribe Medical，并且转录结果将流式传输到您的应用程序。

有关使用亚马逊 Transcribe Medical 进行直播的更多信息，请参阅转录流音频.

请求语法


POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json

{
   "AudioStream": { 
      "AudioEvent": { 
         "AudioChunk": blob
      }
   }
}

URI 请求参数

请求使用以下 URI 参数。

ContentIdentificationType

(PHI)，其中标识到您的成绩单中标识的所有个人健康信息 (PHI)：

内容识别在片段级别执行；音频片段完全转录后会标记 PHI。

有关更多信息，请参阅。识别转录中的个人健康信息 (PHI).

有效值: PHI

EnableChannelIdentification

在多声道音频中启用频道识别。

频道标识会单独转录每个通道上的音频，然后将每个通道的输出附加到一个脚本中。

如果您有多声道音频但未启用频道识别，则您的音频将以连续的方式转录，并且您的成绩单不会按频道分隔。

你不能设置ShowSpeakerLabel和EnableChannelIdentification在同一请求中。如果两者都设置，则请求将返回BadRequestException.

有关更多信息，请参阅。转录多声道音频.

LanguageCode

指定表示音频中所说语言的语言代码。

重要

Amazon Transcribe e Medical 仅支持美式英语 (en-US)。

：是

MediaEncoding

指定用于输入音频的编码。支持的格式为：

FLAC
Ogg 容器中的 Opus 编码音频
PCM（仅有符号的 16 位小端音频格式，不包括 WAV）

有关更多信息，请参阅。媒体格式.

有效值: pcm | ogg-opus | flac

：是

MediaSampleRateHertz

输入音频的采样率（以 Hz 为单位）。Amazon Transcribe e Medical 支持从 16,000 Hz 到 48,000 Hz 的频率范围。请注意，您指定的采样率必须与音频的采样率相匹配。

有效范围：最小值为 8000。最大值为 48000。

：是

NumberOfChannels

指定您的音频流式传输到您的音频流式传输到您的音频中。最多支持两个通道。

有效范围：最小值为 2。

SessionId

为您的转录会话指定一个名称。如果您未在请求中包含此参数，Amazon Transcribe Medical，并且转录到响应中返回该代码。

您可以使用会话 ID 重试流式传输会话。

长度约束：固定长度为 36。

模式：[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

在转录输出中启用说话人识别（二值化）。扬声器标识会在媒体文件中标记单个扬声器的语音。

有关更多信息，请参阅。识别发言人（日记化）.

Specialty

指定音频中包含的医学专业。

：是

Type

指定输入音频的类型。例如，选择DICTATION对于提供者口述患者记录和CONVERSATION在病人和医疗专业人员之间进行对话。

有效值: CONVERSATION | DICTATION

：是

VocabularyName

指定在处理转录时要使用的自定义词汇表的名称。请注意，词汇名称区分大小写。

长度约束：最小长度为 1。最大长度为 200。

模式：^[0-9a-zA-Z._-]+

请求正文

请求接受采用 JSON 格式的以下数据。

AudioStream

音频 blob 的编码流。音频流编码为 HTTP/2 或 WebSocket 数据帧。

有关更多信息，请参阅。转录流音频.

类型：AudioStream 对象

：是

响应语法


HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json

{
   "TranscriptResultStream": { 
      "BadRequestException": { 
      },
      "ConflictException": { 
      },
      "InternalFailureException": { 
      },
      "LimitExceededException": { 
      },
      "ServiceUnavailableException": { 
      },
      "TranscriptEvent": { 
         "Transcript": { 
            "Results": [ 
               { 
                  "Alternatives": [ 
                     { 
                        "Entities": [ 
                           { 
                              "Category": "string",
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "StartTime": number
                           }
                        ],
                        "Items": [ 
                           { 
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "Speaker": "string",
                              "StartTime": number,
                              "Type": "string"
                           }
                        ],
                        "Transcript": "string"
                     }
                  ],
                  "ChannelId": "string",
                  "EndTime": number,
                  "IsPartial": boolean,
                  "ResultId": "string",
                  "StartTime": number
               }
            ]
         }
      }
   }
}