在训练 Job 运行时更新调试器系统监控和框架分析配置 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在训练 Job 运行时更新调试器系统监控和框架分析配置

如果要为当前正在运行的训练作业启用或更新调试器监视和分析配置,请使用以下命令SageMaker估计器扩展方法:

  • 要为正在运行的训练作业启用调试器系统监控并接收调试器性能分析报告,请使用以下命令:

    estimator.enable_default_profiling()

    当您使用enable_default_profiling方法,调试器启动默认的系统监控,ProfileReport内置规则,该规则在培训作业结束时生成全面的概况分析报告。只有当前训练作业在没有调试器监控和分析的情况下运行时,才能调用此方法。

    有关更多信息,请参阅 。估计器 .enable_default_ 分析中的亚马逊SageMakerPython 开发工具包.

  • 要使用自定义配置参数启用调试器内置规则、系统监控和框架分析,请使用以下命令:

    estimator.update_profiler( rules=[ProfilerRule.sagemaker(rule_configs.BuiltInRule())], system_monitor_interval_millis=500, framework_profile_params=FrameworkProfile() )

    有关更多信息,请参阅 。估计器 .update_profiler中的亚马逊SageMakerPython 开发工具包.