Feature Importanceの表示数制限について

Koji
Koji Partner, Dataiku DSS Core Designer, Registered Posts: 54 Partner

モデル学習後、特徴量重要度を見る際、学習に使った特徴量がFeature Importanceで表示されないことがあるのですが、こちらは表示数など制限があるのでしょうか?また、すべての特徴量の重要度を表示することは可能でしょうか?

Answers

  • Tsuyoshi
    Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 307 Dataiker
    edited September 20

    はい。GUI画面上では、Top20の特徴量のみが表示されます。詳細を以下に補足します。

    • Shapley値:GUI画面上の表示、エクスポート・API経由ともに、Top20の特徴量のみが取得されます。
    • Gini値:GUI画面上の表示はTop20までですが、エクスポートした場合にはすべての特徴量が出力されます。(ちなみに、Gini値の場合、特徴量変換後の値が利用されるため、カテゴリ変数は変換後のダミー値の数だけ特徴量が増加します。)

    上記のように、Shapley値は製品仕様上、(計算負荷の観点から)絞り込んだ結果のみ表示しています。もし特徴量重要度を20以上すべて取得したい場合、コードレシピを作成して、scikit-learn等のライブラリを利用したコーディングで対応していただく形になります。

Setup Info
    Tags
      Help me…