weighting strategyの仕様について

Koji
Partner, Dataiku DSS Core Designer, Registered Posts: 51 Partner
in ナレッジシェア(Q&A)
回帰タスクで weighting strategyを使用する際、数値型のカラムを選択すると思いますが、この時選択したカラムの数値の大きさをそのまま重みとしてつかい、相対的にスケールを判断して評価計算を行うのでしょうか?
Best Answer
-
Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 265 Dataiker
回帰モデルのトレーニングに関して、以下URLに記載の「Weighting strategy」に「sample weight」を指定した場合の挙動に関するご質問であると理解しました。
その場合、カラムに入っている数値をそのまま重みとして利用することになるはずです(Dataiku(が内部で利用するscikit learn)側では、値のスケーリングは行なっていないはずです)。このため、値の絶対値をそのまま使うのではなく、正規化やスケーリングが必要な場合、データの前処理で事前に変換を行なっておく必要があると考えられます。
Answers
-
ありがとうございます。重みとして使う場合はそのまま利用されるとのこと理解しました。重みとして使う列も度合などもこちらで手で決める必要があるということですね