Japan User Group (Data Haiker)
-
Dataiku無料版でのデータベースConnectionについてのご質問
ローカルPCにDataikuの無料版をインストールして利用しているのですが、Connectionについて以下の質問がございます。 無料版でPostgreSQLのConnectionは使用できますか? 1が可能な場合、Amazon RDS for PostgreSQL に対しても使用可能ですか?
-
使用PCを変更or追加する場合
無料版(インストール版)を使わせて頂いています。 使用するPCを、仮に、変更or追加する場合について教えてください。 使用するPCを変更or追加する場合、新PCにインストールの上で、適宜のメールアドレスで登録すればよろしいでしょうか? (旧PCと新PCのメールアドレスが、同一でも異なっていても、関係ない、という理解であっていますでしょうか) 使用するPCを追加し、Dataikuの同一プロジェクトについて、 旧PC・新PC両方から作業したい場合(1つ目の図の「最大3ユーザーとコラボレーション可能」のところを見て伺っています)、 旧PCでDataikuに入り、2つ目の図の「+ NEW USER」ボタンから、新PCのほうを追加する、…
-
「[DEBUG] [dku.resource] - Process stats for pid ~」について
【状況】 無料版(インストール版)を使わせて頂いてます。 Code recipes - Pythonで処理(約500,000明細)をしたいのですが、処理開始するものの、(数時間後も)処理完了に至りません。(なので、ABORTを押下) ログには、以下が継続的に出力され続けています。 [DEBUG] [dku.resource] - Process stats for pid 12345: {"pid":12345,"commandName":"C:\(略)\Scripts\python.exe","cpuCurrent":0.0,"cpuAverageOverPast60Seconds":0.0,"vmRSSTotalMBS":0}…
-
ScenarioのForce Buildの挙動について
DataikuのScenarioについて、 [Build dependencies then these items] かつ [Force Build] の設定にした際は上流から設定したデータセットまでのレシピが全て実施され、データセットが再構築される認識です。 そこでご質問なのですが、同じシナリオ内で特定のデータセットAを[Build dependencies then these items] かつ [Force Build] の設定でビルドしたのち、下流の他のデータセットBを同じ設定でビルドした場合、下流のデータセットBのビルドの際は最初のデータセットAも再構築されますでしょうか?…
-
処理速度について
異なるDataiku Cloudの環境で同じフローを構築したのですが、処理にかかる時間が大きく異なります。 原因としてDataiku Coludを立ち上げているインスタンスの性能が影響しているからでしょうか? 特にPythonレシピに大きな差が生まれます。 また、処理速度を速める方法をして何かございますでしょうか?
-
Trainレシピの「実行」を押した際の挙動に関するご質問
モデルをデプロイした後にフローに表示されるTrainレシピを、フロー上のメニューから実行した場合の挙動をご存じの方いますでしょうか?データを更新し再学習をかけようとする際にフロー上からかけられるのか試したところ学習されている挙動が見えずでして…添付画像の「実行」を押した際の挙動について知りたく起票致しました。 よろしくお願いいたします。
-
RAGを構成する際のナレッジバンク(ベクターストア)の構成場所について
https://knowledge.dataiku.com/latest/ml-analytics/gen-ai/concept-rag.html#knowledge-bank-settings 上記リンクを参考にRAGを用いたチャットボットの作成をしようと思っています。 LLMはSnowflakeのCortexAIを使う想定ですが、ベクターストアはDSS上もしくはSnowflakeのどちらに構成されるのかが気になっています。(ちなみに環境はDataikuCloudです)…
-
DataikuCloudでのバージョンアップについて
datiakuCloudを利用していますが、バージョン13.2を使うためには何か特別な操作が必要でしょうか。 https://www.dataiku.com/product/product-updates/version-13/version-13-2/ Cloud版は特にユーザー側での作業がなく、最新版が使えるような認識でいたのですが、現状は以下の通り13.1のままとなっております。
-
WebApp上での操作ユーザーの情報取得の方法
WebApp上でボタンをトリガーにシナリオがRunするように設定しています。 このときボタンをクリックしたRunしたユーザーをデータセットに追加したいと思っています。 この時取得したいユーザーデータとしてWebappを操作している人のデータを取得したいのですが、方法はありますでしょうか?サンプルコードなどあればご教授いただければと思います。
-
DataikuCloudのConcurrency limit(同時実行制限)について
DataikuCloudのversion13をDataiku for Data Analyticsで使用しています。 Launchpadの画面からは以下のように同時実行制限の設定がありますが、 以下質問させてください。 現在の設定は、環境全体で同時実行(アクティビティ数?)が20まで、ジョブごとに3アクティビティまでという設定のようです。 ジョブのアクティビティというのは、フローの実行の場合は各レシピごとの処理が1つのアクティティという理解でよいでしょうか?(処理をプッシュダウンしている場合でも同様の制限がかかる?) また、グローバルのアクティビティ上限はどのように算出されるのでしょうか?