Feature Importanceの表示数制限について

Koji
Partner, Dataiku DSS Core Designer, Registered Posts: 54 Partner
in ナレッジシェア(Q&A)
モデル学習後、特徴量重要度を見る際、学習に使った特徴量がFeature Importanceで表示されないことがあるのですが、こちらは表示数など制限があるのでしょうか?また、すべての特徴量の重要度を表示することは可能でしょうか?
Answers
-
Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 307 Dataiker
はい。GUI画面上では、Top20の特徴量のみが表示されます。詳細を以下に補足します。
- Shapley値:GUI画面上の表示、エクスポート・API経由ともに、Top20の特徴量のみが取得されます。
- Gini値:GUI画面上の表示はTop20までですが、エクスポートした場合にはすべての特徴量が出力されます。(ちなみに、Gini値の場合、特徴量変換後の値が利用されるため、カテゴリ変数は変換後のダミー値の数だけ特徴量が増加します。)
上記のように、Shapley値は製品仕様上、(計算負荷の観点から)絞り込んだ結果のみ表示しています。もし特徴量重要度を20以上すべて取得したい場合、コードレシピを作成して、scikit-learn等のライブラリを利用したコーディングで対応していただく形になります。