创建要素属性基线和可解释性报告 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建要素属性基线和可解释性报告

有关运行方法说明的示例笔记本 SageMaker 澄清 Studio 中的处理作业,为其相对于基线的预测创建解释,请参阅利用亚马逊进行可解释性和偏见检测 SageMaker 澄清.

如果您需要有关如何在亚马逊打开笔记本电脑的说明 SageMaker 工作室,请参阅创建或打开亚马逊 SageMaker Studio Notebook. 以下代码示例来自以前列出的示例笔记本。本节讨论了与使用 Shapley 值相关的代码,以提供比较每个功能所作预测的相对贡献的报告。

使用SHAPConfig来创建基线。在此示例中,mean_abs是指定为基线的所有实例的绝对 SHAP 值的平均值。你用DataConfig以配置目标变量、数据输入和输出路径及其格式。

shap_config = clarify.SHAPConfig(baseline=[test_features.iloc[0].values.tolist()], num_samples=15, agg_method='mean_abs') explainability_output_path = 's3://{}/{}/clarify-explainability'.format(bucket, prefix) explainability_data_config = clarify.DataConfig(s3_data_input_path=train_uri, s3_output_path=explainability_output_path, label='Target', headers=training_data.columns.to_list(), dataset_type='text/csv')
注意

中的 SHAP 内核 SageMaker 澄清支持省略 “基线” 参数。在这种情况下,将自动生成基于输入数据集聚类的基线。

然后运行可解释性作业。

clarify_processor.run_explainability(data_config=explainability_data_config, model_config=model_config, explainability_config=shap_config)

在 Studio 中查看结果或从explainability_output_pathS3 存储桶。