REST APIのGet Datasetのsamplingオプションの指定について
hashio
Registered Posts: 2 ✭✭✭✭
https://doc.dataiku.com/dss/api/10.0/rest/#datasets-dataset-data-get
REST APIの上記ドキュメントにあるsamplingについて
具体的な設定例をご教示いただけますでしょうか。
Best Answer
-
Keiji Dataiker, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 52 Dataiker
ご質問を投稿くださいまして、ありがとうございます。本 API の sampling パラメータにつきまして、いくつか設定例を共有させていただきます。
1. 先頭 N 件のデータを取得
1.1. 形式
sampling=\{"samplingMethod":"HEAD_SEQUENTIAL","maxRecords":N\}
1.2. 例
curl --user MY_API_KEY: \
-H "Content-Type: application/json" \
-X GET \
'http://HOST:PORT/public/api/projects/MYPROJECT/datasets/MYDATASET/data?sampling=\{"samplingMethod":"HEAD_SEQUENTIAL","maxRecords":10\}'2. ランダムサンプリング(全体のおよそ N 割のデータを取得)
2.1. 形式
sampling=\{"samplingMethod":"RANDOM_FIXED_RATIO","targetRatio":0.N\}'
2.2. 例
curl --user MY_API_KEY: \ -H "Content-Type: application/json" \ -X GET \ 'http://HOST:PORT/public/api/projects/MYPROJECT/datasets/MYDATASET/data?sampling=\{"samplingMethod":"RANDOM_FIXED_RATIO","targetRatio":0.1\}'
3. ランダムサンプリング(およそ N 件のデータを取得)
3.1. 形式
sampling=\{"samplingMethod":"RANDOM_FIXED_NB","maxRecords":N\}'
3.2. 例
curl --user MY_API_KEY: \ -H "Content-Type: application/json" \ -X GET \ 'http://HOST:PORT/public/api/projects/MYPROJECT/datasets/MYDATASET/data?sampling=\{"samplingMethod":"RANDOM_FIXED_NB","maxRecords":10\}'
以上です。他にご質問などございましたら、お気軽にお問い合わせいただけますと幸いです。何卒よろしくお願い申し上げます。
Answers
-
ご回答ありがとうございました。
期待通りの動きを確認できました。 -
Keiji Dataiker, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 52 Dataiker
ご確認、ご返信くださいましてありがとうございます。
また何かございましたら、お問い合わせいただけますと幸いです。
引き続き何卒よろしくお願い申し上げます。