Japan User Group (Data Haiker)
-
Automation Nodeへのデプロイ権限について
Dataiku Cloud版でLaunchpad上で以下の権限を割り当てておりますが、Deployer→AutomationNodeへのデプロイがうまく実行できません。(Bundle→Deployerは可能) ・designers ・external_designer ・project_deplyer 権限を割り当てられるように設定することはできますか?また、AutomationNode側で設定が必要になりますか?
-
Dataikuからローカルにデータフレームを読み込む際のpandasのエラーについて
以下のリンクをもとに環境からdataikuライブラリをpip installし、ローカルのJupiter Labを用いてデータフレームを読み込んでいます。 コード環境を設定の上、必要なライブラリをインポートし、以下のようなスクリプトを作成しています。 import dataiku import pandas as pd # DSS サーバーに接続 dataiku.set_remote_dss("URL", "KEY", no_check_certificate=True) client = dataiku.api_client() # プロジェクトキーとデータセット名を指定 project_key = "MY_PROJECT"…
-
Dataiku Answersのエラーについて
Dataiku Answersを動かそうとしたところ、以下のようなライブラリのエラーが表示されます。 プラグインのcode envに新しく追加する必要があるのでしょうか? Dataiku Answers自体はSQLのテーブルとも接続されているはずです。 Dataiku DSSのバージョンは13.3.0になります。
-
Snowflakeでスキーマに半角カッコを持つ列の読み込みでエラーが発生する。
以下のように半角カッコを持つスキーマを読み込んだ際の挙動に関する質問です。 Dataikuに読み込むと以下の図のように半角カッコがアンダースコアに自動変換されます。 ただし、この状態で読み込むと列名の対応で以下のエラーが発生します。 アンダースコアを半角カッコに手動で変更すると読み込むことができますが、データ更新時に再度スキーマの設定がアンダースコアに戻り、同様の設定が必要になるという状況です。 やりたいこととしては、 ・半角カッコを含むスキーマを持つデータセットを読み込む。 ・データ更新時も適切に動作する。…
-
行レベルの特徴量影響度のデータ化について
Dataikuでモデルを構築した後の各特徴量の重要度、影響度について質問です。 What-if分析ではMost influential features for [目的変数]のグラフで設定した各条件に対する特徴量の影響度を確認することができます。 また、モデル全体としての各特徴量の重要度はfeature importanceを確認すれば確認することができます。 ただ、学習または予測を行ったデータセットの各行に対してモデルで使用した列の影響度を算出し、データセット化する方法が分かりません。 どなたかご存じの方がいらっしゃいましたらご教示お願いいたします。
-
Hi team why papular Dataiku ..?
i am working in bny mellon this time Our company has introduced this new tool to us i want KT and documents i am very excited to learn these tools
-
Dataiku無料版でのデータベースConnectionについてのご質問
ローカルPCにDataikuの無料版をインストールして利用しているのですが、Connectionについて以下の質問がございます。 無料版でPostgreSQLのConnectionは使用できますか? 1が可能な場合、Amazon RDS for PostgreSQL に対しても使用可能ですか?
-
使用PCを変更or追加する場合
無料版(インストール版)を使わせて頂いています。 使用するPCを、仮に、変更or追加する場合について教えてください。 使用するPCを変更or追加する場合、新PCにインストールの上で、適宜のメールアドレスで登録すればよろしいでしょうか? (旧PCと新PCのメールアドレスが、同一でも異なっていても、関係ない、という理解であっていますでしょうか) 使用するPCを追加し、Dataikuの同一プロジェクトについて、 旧PC・新PC両方から作業したい場合(1つ目の図の「最大3ユーザーとコラボレーション可能」のところを見て伺っています)、 旧PCでDataikuに入り、2つ目の図の「+ NEW USER」ボタンから、新PCのほうを追加する、…
-
「[DEBUG] [dku.resource] - Process stats for pid ~」について
【状況】 無料版(インストール版)を使わせて頂いてます。 Code recipes - Pythonで処理(約500,000明細)をしたいのですが、処理開始するものの、(数時間後も)処理完了に至りません。(なので、ABORTを押下) ログには、以下が継続的に出力され続けています。 [DEBUG] [dku.resource] - Process stats for pid 12345: {"pid":12345,"commandName":"C:\(略)\Scripts\python.exe","cpuCurrent":0.0,"cpuAverageOverPast60Seconds":0.0,"vmRSSTotalMBS":0}…
-
ScenarioのForce Buildの挙動について
DataikuのScenarioについて、 [Build dependencies then these items] かつ [Force Build] の設定にした際は上流から設定したデータセットまでのレシピが全て実施され、データセットが再構築される認識です。 そこでご質問なのですが、同じシナリオ内で特定のデータセットAを[Build dependencies then these items] かつ [Force Build] の設定でビルドしたのち、下流の他のデータセットBを同じ設定でビルドした場合、下流のデータセットBのビルドの際は最初のデータセットAも再構築されますでしょうか?…