Dataikuソリューション:Credit Card Fraudのフロー実行に失敗する - Fail to execute "Credit Card Fraud"
Dataikuソリューション:Credit Card Fraudの開始後、フローを全体で実行した際に、"compute_combinations_cust_term"と"compute_tx_filtered"の2か所で参照できない変数がある旨のエラーが発生しました。(添付画像)
プロジェクトの開始後は、どのDataset・レシピも一切編集していません。
事前に環境変数の設定が必要なのかと思いましたが、ソリューションは手を加えることなく実行できる状態で展開される認識です。
エラーの原因と対処法を教えていただければと存じます。
After I started the Dataiku solution: Credit Card Fraud and ran the entire flow, errors occurred in two places: "compute_combinations_cust_term" and "compute_tx_filtered" indicating that there are variables that cannot be referenced (see attached image). I have not edited any datasets or recipes after starting the project.
I thought it might be necessary to set environment variables in advance, but I understand that the solution is deployed in a state where it can be executed without any modifications. Please tell me the cause of the errors and how to fix them.
Answers
-
Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 137 Dataiker
@Tatsuhiro さん、ご質問ありがとうございます!
上記のソリューションを実行するためには、フロー上で「全てをビルド(Build All)」を実行するのではなく、以下ドキュメントに記載のように、「アプリケーション」からフローをセットアップする必要があります。
https://gallery.dataiku.com/projects/SOL_CC_FRAUD/wiki/1/User%20Manual
セットアップ手順について、スクリーンショットを撮りましたので、以下、簡単に手順をご説明します。
HOME画面で、アプリケーションをクリックします。
アプリケーションを利用して、分析用のプロジェクトインスタンスを登録します。
アプリケーションの画面で、(Optional) と書いてある以外のRUN NOWボタンを上から順次クリックして、実行します。
注意事項:デモを行う目的であれば、この処理は「1. Train & Deploy a First Model」のセクションに対してのみ行えば良いです(2番以降のセクションは、APIノードなど環境がセットアップされていないと処理に失敗します)。
また、処理によっては、完了までかなり時間がかかるため、次のボタンを押す前に、完了まで待つ必要があります。(待ち時間の間は、別の作業などに時間を充てていただければと思います!)
上記が終わりましたら、次に、ダッシュボードの表示に必要なシナリオを実行します。
これで、全てのダッシュボードの表示が可能となるはずです。デモ用途であれば、ここまででOKだと思います。(実運用の際には、フローのコネクションをデータベースに変更したり、APIノードをセットアップするなどの考慮が別途必要になります。)
-
@Tsuyoshi さん、丁寧なご回答ありがとうございます!
仰る通りデモ用途のため、1. Train & Deploy a First Model セクションのみで RUN NOW を実行したところ、変数が作成され、エラーが解消したことを確認できました。
ソリューションからプロジェクトを作成した場合は、アプリケーション画面に沿って(またはScenariosから)RUNする必要があると理解いたしました。
-
Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 137 Dataiker
@Tatsuhiro さん、ご確認ありがとうございました!
はい、Dataiku ビジネスソリューションのプロジェクト・フローはあくまでも「テンプレート」として提供されているものが多いです。このため、利用する際は「アプリケーション」を利用して、利用用途・ユーザー毎に別々のプロジェクトインスタンスを立ち上げる前提になっていたりします。
Credit Card Fraudに関しても、アプリケーションを利用したセットアップが前提となっていました。また、ご不明な点などありましたらご連絡ください。引き続き、どうぞよろしくお願いいたします!