Japan User Group (Data Haiker)
-
DataikuとTableau Serverの連携について
DataikuのTableau Hyper formatを用いて可視化用のデータセットをDataikuで整形し、Tableau Serverへアップロードすることを検討しており、ご質問です。 DataikuからTableau Serverへのデータ連携の選択肢として ・Tableau Hyper formatプラグインを用いての接続 ・DataikuからSnowflakeに出力したものにTableauから接続 の2通りの選択肢が取れる認識でおります。 それぞれメリット、デメリットが有ると思いますが、速度の観点でどちらが高速か知見をお持ちの方いらっしゃいますでしょうか? また、考えられるリスクなどございますでしょうか?…
-
ローカルデータのインポート制限
プロジェクトにローカルデータをアップロードする際に「ファイルをアップロード」を選択するかと思いますが、アップロードできなくする制限をかけることはできますでしょうか? また上記が可能な場合について、Snowflake等のデータベースからはデータを接続できるように設定できますでしょうか?(事前にConnectionを設定しています。)
-
Vector Storeの違いによるDataiku Answersの回答生成不具合
Dataiku Cloud バージョン13.3.1で埋め込みを行う場合、FAISSを使用したKnowledge bankだと回答が生成されず、ChromaDBに変更すると生成されるようになります。これらの事象の解決策などありますでしょうか? ログを見てみるとpermission deniedとあるので何かしら権限がない状況になっているのかと思いますが、原因が分かりません
-
LLM Mesh機能を利用して、全体に対する要約を実施したい。
例えばX(Twitter)のデータで、それぞれの投稿(1つぶやき)を要約することはSummarizeレシピでできると思いますが、とある日の全関連投稿(Ex. Dataiku)に関する投稿の要約を行いたい場合、どのように実施できますか? Ex. 投稿内容:Dataiku 投稿日:今日(12/25) → つまり、12/25に世界中でDataikuについて投稿があったものを要約(傾向を把握)したい。
-
Dataiku AnswersのDocument Folderについて
Dataiku AnswersではDocument Folderを設定しないと動かないのですが、この設定を有効にしておく理由は何かあるのでしょうか。画像生成を行うのであればフォルダは用意しておく必要はありそうな気がするのですが、ただのチャットボットの機能を使うだけであれば必要なのかなと思っています。ドキュメントを見てもよくわからないので質問してみました https://doc.dataiku.com/dss/latest/generative-ai/answers.html#document-folder
-
Automation Nodeへのデプロイ権限について
Dataiku Cloud版でLaunchpad上で以下の権限を割り当てておりますが、Deployer→AutomationNodeへのデプロイがうまく実行できません。(Bundle→Deployerは可能) ・designers ・external_designer ・project_deplyer 権限を割り当てられるように設定することはできますか?また、AutomationNode側で設定が必要になりますか?
-
Dataikuからローカルにデータフレームを読み込む際のpandasのエラーについて
以下のリンクをもとに環境からdataikuライブラリをpip installし、ローカルのJupiter Labを用いてデータフレームを読み込んでいます。 コード環境を設定の上、必要なライブラリをインポートし、以下のようなスクリプトを作成しています。 import dataiku import pandas as pd # DSS サーバーに接続 dataiku.set_remote_dss("URL", "KEY", no_check_certificate=True) client = dataiku.api_client() # プロジェクトキーとデータセット名を指定 project_key = "MY_PROJECT"…
-
Dataiku Answersのエラーについて
Dataiku Answersを動かそうとしたところ、以下のようなライブラリのエラーが表示されます。 プラグインのcode envに新しく追加する必要があるのでしょうか? Dataiku Answers自体はSQLのテーブルとも接続されているはずです。 Dataiku DSSのバージョンは13.3.0になります。
-
Snowflakeでスキーマに半角カッコを持つ列の読み込みでエラーが発生する。
以下のように半角カッコを持つスキーマを読み込んだ際の挙動に関する質問です。 Dataikuに読み込むと以下の図のように半角カッコがアンダースコアに自動変換されます。 ただし、この状態で読み込むと列名の対応で以下のエラーが発生します。 アンダースコアを半角カッコに手動で変更すると読み込むことができますが、データ更新時に再度スキーマの設定がアンダースコアに戻り、同様の設定が必要になるという状況です。 やりたいこととしては、 ・半角カッコを含むスキーマを持つデータセットを読み込む。 ・データ更新時も適切に動作する。…
-
行レベルの特徴量影響度のデータ化について
Dataikuでモデルを構築した後の各特徴量の重要度、影響度について質問です。 What-if分析ではMost influential features for [目的変数]のグラフで設定した各条件に対する特徴量の影響度を確認することができます。 また、モデル全体としての各特徴量の重要度はfeature importanceを確認すれば確認することができます。 ただ、学習または予測を行ったデータセットの各行に対してモデルで使用した列の影響度を算出し、データセット化する方法が分かりません。 どなたかご存じの方がいらっしゃいましたらご教示お願いいたします。