Feature Importanceの表示数制限について

Koji
Partner, Dataiku DSS Core Designer, Registered Posts: 52 Partner
in ナレッジシェア(Q&A)
モデル学習後、特徴量重要度を見る際、学習に使った特徴量がFeature Importanceで表示されないことがあるのですが、こちらは表示数など制限があるのでしょうか?また、すべての特徴量の重要度を表示することは可能でしょうか?
Answers
-
Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 289 Dataiker
はい、GUI画面上に表示される特徴量はTop20までとなっています。少し詳細を以下に記載します。
Shapley値に関しては、GUI画面上の表示、エクスポート、APIともにTop20までという仕様になっています。
Gini値を選んだ場合、GUI画面上の表示はTop20までですが、エクスポートすることで、すべての特徴量が出力されます。(Gini値の場合は特徴量変換後の結果が利用されるため、カテゴリ変数に関しては、変換されたダミー値の数だけ特徴量が増えることになります。)
上記のようにShapley値に関しては、(計算負荷の観点から)製品仕様上、絞り込んだ結果を表示しています。もし、特徴量重要度のShapley値を20以上すべて取得したい場合には、別途コードレシピを利用して、scikit-learn等のライブラリを利用して、コーディングで確認していただく対応となります。