インスタンス・ワークスペースをまたいだコラボレーションについて
最近Dataikuユーザーのサポートに関わることになりました。まだまだ分からないことが多く、ざっくりとした質問になってしまいますが、お分かりの方がいたらお教えください。
ユーザーがPC(1台のオンプレサーバー)にDataikuをインストールし、MLOpsを実現しようとしています。作業としては、「デザインノード」でフローの構築や機械学習のモデルづくりをし、それを「自動化ノード」や「APIノード」にデプロイして、スケジュール実行や外部とのリアルタイム連携をしたりすることになるかと思います。そして、Dataiku Cloudの場合、それぞれのノードは分かれており、別々のリソースで実行されると認識しました。
しかし、今回はリソースはPC1台であり、ノードが分かれていても、結局は共通のリソースを開発と運用で奪い合う形になり、どうしても開発でリソースを消費しがちになるとのことです。そこで、開発と運用でPCを分けて(ワークスペースも分けて)、別々にしたいという話が出ています。
私は、開発も運用も一つのインスタンス、一つのワークスペース内で行うべきと認識していたのですが、そのようなインスタンスやワークスペースをまたいだコラボレーションは可能なのでしょうか。
Answers
-
Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 438 DataikerDataikuのサーバを構成する場合、開発用のインスタンス(Design Node)、本番用のインスタンス(Automation Node)を分けるのは通常の構成であり、ベストプラクティスとなります。デザインノードで開発したフロー・モデルを自動化ノードにデプロイする運用となります。この点に関しましては、以下リンクのドキュメントなどをご参照ください。
また、オンプレミスサーバをご利用とのことですので、Dataikuのインストールは「Custom」を利用します。その場合、一つのサーバ上に複数のノードをインストールすることも技術的には可能ですが、リソースの分離を考えますと、やはり開発と運用でサーバのインスタンスを分けてインストールを行うのが通常の方法になります。もし特定のお客様の構成についてご不明な点がございましたら、Dataikuメンバーからアドバイス可能な場合もございますので、必要な場合は個別にコンタクトいただいても良いかもしれません。
また、最近Dataikuに関わることになられたとのことですので、ぜひ以下リンクのラーニングパスを一通り実施していただきまして、認定資格をご取得いただくことをお勧めします。引き続き、どうぞよろしくお願いいたします。
-
ご回答ありがとうございます。早速、MLOpsのラーニングパスを受講しました。
- 開発用と本番用の環境をインスタンスを分けて構築し、またそれらをつなぐものとして、デプロイヤーノードも(それも別のインスタンスに?)立てる
- 開発用環境でバンドルを作成して、デプロイヤーでターゲットとなる本番環境にデプロイする
という感じで大まかな流れとしては合っていますでしょうか。
-
Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 438 Dataiker早速ラーニングパスをご受講いただいたとのこと、ありがとうございます。はい、大きな流れとしては合っております。ただ、「デプロイヤーノードも(それも別のインスタンスに?)立てる」という部分につきましては、必ずしも別インスタンスでなくても結構です。
以下リンクのドキュメントに記載のように、デザインノードには初めから「ローカルデプロイヤー」が組み込まれていますので、「リモートデプロイヤー」が特に不要な場合は、デザインノード上の「ローカルデプロイヤー」をそのままご利用いただくことも可能です。
https://doc.dataiku.com/dss/latest/deployment/setup.html -
補足でのご説明ありがとうございます!