weighting strategyの仕様について

Koji
Koji Partner, Dataiku DSS Core Designer, Registered Posts: 51 Partner

回帰タスクで weighting strategyを使用する際、数値型のカラムを選択すると思いますが、この時選択したカラムの数値の大きさをそのまま重みとしてつかい、相対的にスケールを判断して評価計算を行うのでしょうか?

Best Answer

  • Tsuyoshi
    Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 265 Dataiker
    Answer ✓

    回帰モデルのトレーニングに関して、以下URLに記載の「Weighting strategy」に「sample weight」を指定した場合の挙動に関するご質問であると理解しました。
    https://doc.dataiku.com/dss/latest/machine-learning/supervised/settings.html#setting-weighting-strategy

    その場合、カラムに入っている数値をそのまま重みとして利用することになるはずです(Dataiku(が内部で利用するscikit learn)側では、値のスケーリングは行なっていないはずです)。このため、値の絶対値をそのまま使うのではなく、正規化やスケーリングが必要な場合、データの前処理で事前に変換を行なっておく必要があると考えられます。

Answers

  • Koji
    Koji Partner, Dataiku DSS Core Designer, Registered Posts: 51 Partner

    @Tsuyoshi

    ありがとうございます。重みとして使う場合はそのまま利用されるとのこと理解しました。重みとして使う列も度合などもこちらで手で決める必要があるということですね

  • Tsuyoshi
    Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 265 Dataiker

    @Koji はい。現状の仕様では、そのように動作するはずですので、「sample weight」を利用される場合は、必要に応じて適切な値を設定して頂ければと思います。

Setup Info
    Tags
      Help me…