排除 Docker 容器故障排除 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

排除 Docker 容器故障排除

将 Docker 容器与 SageMaker 结合使用时,可能会遇到以下常见错误。每个错误之后都是错误的解决方案。

  • Error: SageMaker 已经丢失 Docker 守护程序。

    要修复此错误,请使用以下命令重新启动 Docker。

    sudo service docker restart
  • Error: 这些区域有:/tmp您 Docker 容器的目录已经用尽了空间。

    使用 Docker 容器//tmp用于存储代码的分区。在本地模式下使用大型代码模块时,这些分区可以很容易填满。SageMaker Python SDK 支持为本地模式根目录指定自定义临时目录以避免此问题。

    要在 EBS 卷存储中指定自定义临时目录,请在以下路径中创建一个文件~/.sagemaker/config.yaml然后添加以下配置。您指定为的目录container_root必须已存在。SageMaker Python SDK 不会尝试创建它。

    local: container_root: /home/ec2-user/SageMaker/temp

    使用此配置,本地模式使用/temp目录而不是默认/tmp目录。