Dataiku CloudStack版における各nodeの自動起動・停止について

長戸
長戸 Partner, Registered, Data Haiker Member Posts: 18 Partner

表題について質問させてください。クラウドはAWSを想定しています。

Fleet Managerでは自動起動・停止の機能がないため、
AWS側のEventBridge等のスケジューラで制御する必要がある理解です。
ReprovisionのたびにIPが変更される — Dataiku Community

そこで、二点確認させて下さい。
- DesignNode等の該当のEC2をAWS側で停止・起動した際に、OS起動とともに正しくプロセスが立ち上がるのかどうか等、各ノードに影響はないでしょうか。
- Fleet Manager側から見て、整合性のとれた状態を維持できますでしょうか。

初歩的な質問で恐縮ですが、お答えいただけますと幸いです。

Answers

  • Tsuyoshi
    Tsuyoshi Dataiker, PartnerAdmin, Dataiku DSS Core Designer, Dataiku DSS ML Practitioner, Dataiku DSS Adv Designer, Registered Posts: 332 Dataiker

    以下、コメントさせていただきます。

    DesignNode等の該当のEC2をAWS側で停止・起動した際に、OS起動とともに正しくプロセスが立ち上がるのかどうか等、各ノードに影響はないでしょうか。

    EC2をAWS側で停止・起動した場合、OS起動とともにDSSのプロセスが立ち上がりますが、ご質問内のリンク先コメントにもありますように、ジョブ実行中にノードを停止した場合など、データセット不整合などの問題が発生する可能性があります。このため、AWS側でEC2を直接停止・起動することは推奨しておりません。

    外部のスケジューラーなどからDSSを停止・起動したい場合は、以下のFleet Manager API経由で各ノードをdeprovision / reprovision する方法がよいと考えられます。
    https://developer.dataiku.com/latest/api-reference/python/fleetmanager.html#fleet-manager-instances

    Fleet Manager側から見て、整合性のとれた状態を維持できますでしょうか。

    上記回答に記載のように、Fleet Manager API経由で各ノードをdeprovision / reprovision することで、整合性をとりつつ、各ノードとDSSプロセスの停止・起動を行うことが可能と考えられます。(ただ、予期せぬ業務への影響を考慮して、通常は本番環境インスタンスの自動停止・起動は行わないことを推奨していますので、その点はご考慮いただければと思います。)

Setup Info
    Tags
      Help me…