本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
配置调试器监视硬件系统资源利用率
要调整调试器系统监控时间间隔,请使用ProfilerConfigAPI 操作用于在构建SageMaker框架或通用估计器取决于你的偏好。
默认情况下,对于所有SageMaker训练作业时,调试器每 500 毫秒从 Amazon EC2 实例收集硬件系统利用率数据以进行系统监控,而不在中指定任何调试器特定参数SageMaker估算程序。
调试器将系统指标保存在默认 S3 存储桶中。默认 S3 存储桶 URI 的格式为s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/.
以下示例代码说明了如何设置profiler_config系统监视时间间隔为 1000 毫秒的参数。
from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=1000)
-
system_monitor_interval_millis(int) — 指定记录系统指标的监控间隔(以毫秒为单位)。可用值为 100、200、500、1000(1 秒)、5000(5 秒)和 60000(1 分钟)毫秒。默认值是 500 毫秒。
要查看系统监控的进度,请参阅打开 Amazon SageMaker 调试程序见解控制面板.