本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
I/O 绑定运算符
最好避免在数据路径上依赖外部系统。保持参考数据集处于状态,而不是查询外部系统来丰富个别事件,通常性能要高得多。但是,有时候,有些依赖项无法轻松移动到状态,例如,如果您想使用 Amazon Sageemaker 上托管的机器学习模型丰富事件。
通过网络与外部系统接口的运营商可能会成为瓶颈并造成背压。强烈建议使用AsyncIO
此外,对于具有 I/O 绑定运算符的应用程序,增加ParallelismPerKPUKinesis Data Analytics 应用程序的设置。此配置描述应用程序在其每个 Kinesis 处理单元 (KPU) 可以执行的 parallel 行子任务数。通过将值从默认值 1 增加到(比如 4),应用程序利用了相同的资源(并且具有相同的成本),但可以扩展到并行度的 4 倍。这对于 I/O 绑定的应用程序来说很有效,但它会给未绑定 I/O 的应用程序带来额外的开销。