REST APIのGet Datasetのsamplingオプションの指定について

Solved!
hashio
Level 1
REST APIのGet Datasetのsamplingオプションの指定について

https://doc.dataiku.com/dss/api/10.0/rest/#datasets-dataset-data-get

REST APIの上記ドキュメントにあるsamplingについて
具体的な設定例をご教示いただけますでしょうか。

1 Solution
KeijiY
Dataiker

ご質問を投稿くださいまして、ありがとうございます。本 API の sampling パラメータにつきまして、いくつか設定例を共有させていただきます。

 

1. 先頭 N 件のデータを取得 

1.1. 形式

sampling=\{"samplingMethod":"HEAD_SEQUENTIAL","maxRecords":N\}

1.2. 例

curl --user MY_API_KEY: \
-H "Content-Type: application/json" \
-X GET \
'http://HOST:PORT/public/api/projects/MYPROJECT/datasets/MYDATASET/data?sampling=\{"samplingMethod":"HEAD_SEQUENTIAL","maxRecords":10\}'

 

2. ランダムサンプリング(全体のおよそ N 割のデータを取得) 

2.1. 形式

sampling=\{"samplingMethod":"RANDOM_FIXED_RATIO","targetRatio":0.N\}'

2.2. 例

curl --user MY_API_KEY: \
     -H "Content-Type: application/json" \
     -X GET \
     'http://HOST:PORT/public/api/projects/MYPROJECT/datasets/MYDATASET/data?sampling=\{"samplingMethod":"RANDOM_FIXED_RATIO","targetRatio":0.1\}'

 

3. ランダムサンプリング(およそ N 件のデータを取得) 

3.1. 形式

sampling=\{"samplingMethod":"RANDOM_FIXED_NB","maxRecords":N\}'

3.2. 例

curl --user MY_API_KEY: \
     -H "Content-Type: application/json" \
     -X GET \
     'http://HOST:PORT/public/api/projects/MYPROJECT/datasets/MYDATASET/data?sampling=\{"samplingMethod":"RANDOM_FIXED_NB","maxRecords":10\}'

 

以上です。他にご質問などございましたら、お気軽にお問い合わせいただけますと幸いです。何卒よろしくお願い申し上げます。

View solution in original post

3 Replies
KeijiY
Dataiker

ご質問を投稿くださいまして、ありがとうございます。本 API の sampling パラメータにつきまして、いくつか設定例を共有させていただきます。

 

1. 先頭 N 件のデータを取得 

1.1. 形式

sampling=\{"samplingMethod":"HEAD_SEQUENTIAL","maxRecords":N\}

1.2. 例

curl --user MY_API_KEY: \
-H "Content-Type: application/json" \
-X GET \
'http://HOST:PORT/public/api/projects/MYPROJECT/datasets/MYDATASET/data?sampling=\{"samplingMethod":"HEAD_SEQUENTIAL","maxRecords":10\}'

 

2. ランダムサンプリング(全体のおよそ N 割のデータを取得) 

2.1. 形式

sampling=\{"samplingMethod":"RANDOM_FIXED_RATIO","targetRatio":0.N\}'

2.2. 例

curl --user MY_API_KEY: \
     -H "Content-Type: application/json" \
     -X GET \
     'http://HOST:PORT/public/api/projects/MYPROJECT/datasets/MYDATASET/data?sampling=\{"samplingMethod":"RANDOM_FIXED_RATIO","targetRatio":0.1\}'

 

3. ランダムサンプリング(およそ N 件のデータを取得) 

3.1. 形式

sampling=\{"samplingMethod":"RANDOM_FIXED_NB","maxRecords":N\}'

3.2. 例

curl --user MY_API_KEY: \
     -H "Content-Type: application/json" \
     -X GET \
     'http://HOST:PORT/public/api/projects/MYPROJECT/datasets/MYDATASET/data?sampling=\{"samplingMethod":"RANDOM_FIXED_NB","maxRecords":10\}'

 

以上です。他にご質問などございましたら、お気軽にお問い合わせいただけますと幸いです。何卒よろしくお願い申し上げます。

hashio
Level 1
Author

ご回答ありがとうございました。
期待通りの動きを確認できました。

KeijiY
Dataiker

ご確認、ご返信くださいましてありがとうございます。

また何かございましたら、お問い合わせいただけますと幸いです。

引き続き何卒よろしくお願い申し上げます。

0 Kudos