本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
创建要素属性基线和可解释性报告
有关运行方法说明的示例笔记本 SageMaker 澄清 Studio 中的处理作业,为其相对于基线的预测创建解释,请参阅利用亚马逊进行可解释性和偏见检测 SageMaker 澄清
如果您需要有关如何在亚马逊打开笔记本电脑的说明 SageMaker 工作室,请参阅创建或打开亚马逊 SageMaker Studio Notebook. 以下代码示例来自以前列出的示例笔记本。本节讨论了与使用 Shapley 值相关的代码,以提供比较每个功能所作预测的相对贡献的报告。
使用SHAPConfig来创建基线。在此示例中,mean_abs是指定为基线的所有实例的绝对 SHAP 值的平均值。你用DataConfig以配置目标变量、数据输入和输出路径及其格式。
shap_config = clarify.SHAPConfig(baseline=[test_features.iloc[0].values.tolist()], num_samples=15, agg_method='mean_abs') explainability_output_path = 's3://{}/{}/clarify-explainability'.format(bucket, prefix) explainability_data_config = clarify.DataConfig(s3_data_input_path=train_uri, s3_output_path=explainability_output_path, label='Target', headers=training_data.columns.to_list(), dataset_type='text/csv')
中的 SHAP 内核 SageMaker 澄清支持省略 “基线” 参数。在这种情况下,将自动生成基于输入数据集聚类的基线。
然后运行可解释性作业。
clarify_processor.run_explainability(data_config=explainability_data_config, model_config=model_config, explainability_config=shap_config)
在 Studio 中查看结果或从explainability_output_pathS3 存储桶。