Feature Importanceの表示数制限について

Koji
Koji Partner, Dataiku DSS Core Designer, Registered Posts: 52 Partner

モデル学習後、特徴量重要度を見る際、学習に使った特徴量がFeature Importanceで表示されないことがあるのですが、こちらは表示数など制限があるのでしょうか?また、すべての特徴量の重要度を表示することは可能でしょうか?

Answers

  • Tsuyoshi
    Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 289 Dataiker

    はい、GUI画面上に表示される特徴量はTop20までとなっています。少し詳細を以下に記載します。

    Shapley値に関しては、GUI画面上の表示、エクスポート、APIともにTop20までという仕様になっています。

    Gini値を選んだ場合、GUI画面上の表示はTop20までですが、エクスポートすることで、すべての特徴量が出力されます。(Gini値の場合は特徴量変換後の結果が利用されるため、カテゴリ変数に関しては、変換されたダミー値の数だけ特徴量が増えることになります。)

    上記のようにShapley値に関しては、(計算負荷の観点から)製品仕様上、絞り込んだ結果を表示しています。もし、特徴量重要度のShapley値を20以上すべて取得したい場合には、別途コードレシピを利用して、scikit-learn等のライブラリを利用して、コーディングで確認していただく対応となります。

Setup Info
    Tags
      Help me…