I/O 绑定运算符 - Amazon Kinesis Data Analytics
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

I/O 绑定运算符

最好避免在数据路径上依赖外部系统。保持参考数据集处于状态,而不是查询外部系统来丰富个别事件,通常性能要高得多。但是,有时候,有些依赖项无法轻松移动到状态,例如,如果您想使用 Amazon Sageemaker 上托管的机器学习模型丰富事件。

通过网络与外部系统接口的运营商可能会成为瓶颈并造成背压。强烈建议使用AsyncIO以实现该功能,以减少单个呼叫的等待时间并避免整个应用程序放慢速度。

此外,对于具有 I/O 绑定运算符的应用程序,增加ParallelismPerKPUKinesis Data Analytics 应用程序的设置。此配置描述应用程序在其每个 Kinesis 处理单元 (KPU) 可以执行的 parallel 行子任务数。通过将值从默认值 1 增加到(比如 4),应用程序利用了相同的资源(并且具有相同的成本),但可以扩展到并行度的 4 倍。这对于 I/O 绑定的应用程序来说很有效,但它会给未绑定 I/O 的应用程序带来额外的开销。