Data Haiker Connect Japan
-
Space ownerを凍結する場合のベストプラクティス
Space ownerはspace_administratorグループに所属していて、グループから外すことも、ユーザーとして削除することもできない認識です。 このようなDataiku Cloud全体にアクセス権限を持つ特権ユーザは運用上凍結扱いにして、環境を破壊しないような運用にしたいと考えております。 上記踏まえて2点教えてください。 ・Space ownerを運用上利用しない(凍結する)場合はどのような支障が出ると想定されるでしょうか。Space…
-
AutoMLクラスタリングにおけるPCA適用後の factor 変数の意味と、元変数との対応関係の確認方法について
お世話になっております。AutoML のクラスタリング機能について質問です。 AutoMLクラスタリングで Dimensionality Reduction にて「Perform dimensionality reduction (PCA)」 を選択して学習を実行しました。 その結果画面において、factor0,factor1, … といった変数が表示されていますが、これらは PCAによって縮約された後の変数(=クラスタリングのトレーニングに実際に使用された特徴量) という理解で正しいでしょうか。 また、PCAで縮約された各 factor と、投入した元の変数との関係(ロード量・寄与度など)を確認したいと考えています。…
-
Privatelink接続におけるDataiku Cloud側の接続元AWSアカウント
LaunchPadから設定できるPrivateLinkのExtensionについて、SnowflakeとAWSのもので接続元となるDataiku Cloud側のAWSアカウントIDが異なるように見えます。 AWS private endpoint: Add the following ARN as an allowed principal to your endpoint service:(ARNの値に含まれるアカウントID) AWS Snowflake endpoint: Please enable AWS PrivateLink for our Your Snowflake account ID account from the…
-
GovernNodeでのバンドルの承認時にパブリッシュ先のAutomationを指定する方法
GovernNodeでバンドルを承認してからAutomationNodeにデプロイするというフローを構築していますが、AutomationNodeが複数環境が存在する場合に制御することは可能でしょうか? 例としまして、DesignNode、AutomationNode1、AutomationNode2という環境があり、DesignNodeで作成したバンドルをAutomationNode1にパブリッシュしたいとなった場合に、パブリッシュの承認をGovernNodeで行いますが、パブリッシュ先の対象をAutomationNode1だけに限定し、誤ってAutomationNode2にパブリッシュできないようにしたい というのが今回の要望になります。
-
Automation NodeにおけるCode Envについて
Automation Nodeにて、Code Envを新規作成しようとすると、添付のような警告が表示されます。 Dataikuの推奨ではDesign NodeのCode Envをそのまま流用することが推奨されていると認識したのですが、Automation NodeでCode Envを手動作成し、デプロイしたプロジェクト等に紐づけることはできないのでしょうか。 基本的には推奨の方式で問題ないとは考えていますが、DeployerにあるConnection Remappingのように、Code EnvのRemapping機能はありますでしょうか。 他に、Automation…
-
GovernNodeにおけるBlueprintとそのバージョンの切り分けについて
GovernNodeで特定のプロジェクトやバンドルをGovern状態にしようとすると以下のフォームが表示されます。この中の2:Project templateについて、Blueprint Designerで設定したバージョンが表示されますが認識あってますでしょうか? 上記の認識があっている場合、Blueprint DesignerのどのBlueprintが選択されているものでしょうか?また、Blueprintの変更は可能でしょうか? Blueprintとそのバージョンにおける切り分けがよくわからないので、ご存じの方はご教授いただけますと幸いです。 [引用]…
-
What ifの「Optimize outcone」機能について
AutoMLのResult画面でWhat ifがあり、その中で結果の最適化として、「Optimize outcone」という機能がありますが、そちらについて3つ質問があり、ご回答いただくことは可能でしょうか? ①「Optimize outcome」機能では、指定した探索領域からどのように最適値を探索しているか。 ②「Optimize outcome」を実行した際に、計算される「Plausibility」が95%は何を示しているのか。また何を根拠に計算しているか。 ③各変数のmin max設定を外挿領域に設定した場合も計算できるか、その時の予測精度も「Plausibility」で確認できるか。 よろしくお願いいたします。
-
シナリオのReportersの操作ログ
Reportesの操作ログをAudit logsから取得しようとしていますが可能でしょうか。 また、その場合はメッセージにどのようなキーワードが含まれるでしょうか。 Reportersを利用すると社外のメールアドレスを宛先にできてしまうため、Dataiku内部の情報などを外部に転送できてしまうためセキュリティ面を気にしています。ログを追跡することで外部通知されたかを検知するためにReportersの操作ログを確認したいと考えています。
-
Cloud Resources Usage Monitoring ダッシュボードで「Root path of the dataset does not exist」/メトリクス用 dataset はデ
以下のドキュメントを参考に、Cloud Resources Usage Monitoring のダッシュボードを利用しようとしています。 https://knowledge.dataiku.com/latest/cloud-quotas-compute/reference-elastic-ai-compute-capacity.html 状況として、Cloud Resources Usage Monitoring のプロジェクトは存在していますが、ダッシュボードを開くと各 Insight でデータが表示されず、以下のエラーが出ます。 Root path of the dataset does not exist…
-
インスタンス・ワークスペースをまたいだコラボレーションについて
最近Dataikuユーザーのサポートに関わることになりました。まだまだ分からないことが多く、ざっくりとした質問になってしまいますが、お分かりの方がいたらお教えください。 ユーザーがPC(1台のオンプレサーバー)にDataikuをインストールし、MLOpsを実現しようとしています。作業としては、「デザインノード」でフローの構築や機械学習のモデルづくりをし、それを「自動化ノード」や「APIノード」にデプロイして、スケジュール実行や外部とのリアルタイム連携をしたりすることになるかと思います。そして、Dataiku Cloudの場合、それぞれのノードは分かれており、別々のリソースで実行されると認識しました。…