ナレッジシェア(Q&A)

Sort by:
1 - 10 of 122
  • 現在Pythonレシピを用いて出力するデータセット名に出力日時を加えたいと考えています。 Pythonレシピで出力データセット名に付けたいデータセット名を指定したところ、 <class 'Exception'>: Dataset "データセット名" cannot be used : declare it as input or output of your recipe というエラーが出ます。 P…
    Answered ✓
    Started by tomoyoshi
    Most recent by Tsuyoshi
    0
    2
    tomob
    Solution by tomob

    少し無理やりなやり方で、意向に沿う形ではないかもしれませんが以下の方法では可能です。

    1. レシピ内で動的な名前のデータセットを作成
      DataikuのPython APIを使用して、新しいデータセットを動的に作成できます。ただし、この場合、ignore_flow=Trueオプションを使用してフローのチェックを無効化する必要があります。
    2. 出力先として「マネージドフォルダ」を使用
      Dataikuでは、マネージドフォルダを利用して動的なファイル名でデータを書き出すことが可能です。Pythonスクリプト内でファイル名にタイムスタンプやその他の情報を追加できます。
    3. レシピの入出力設定に「ダミー」データセットを指定
      Pythonレシピは必ず出力データセットが必要ですが、動的な名前で処理したい場合は「ダミー」の出力データセットを設定し、実際の処理はAPIやマネージドフォルダで行う方法もあります。

    注意点
    動的に作成したデータセットやファイルは、Dataikuフロー上では明示的に表示されません。そのため、後続の処理で利用する場合は注意が必要です。
    Dataiku内でフロー全体の整合性を保つためには、可能な限り事前に定義された入出力設定を利用することが推奨されます。

    おそらく後続の処理での利用も想定された上で動的に名前をつけるのだと思いますが、参考までに。

  • お世話になっております。 Dataiku13.4.0のドキュメント埋め込み機能について質問がございます。 ドキュメントの埋め込み機能を用いてベクトルストアを生成したのですが、こちらを用いてPromptStadioとノートブック上でクエリを実行した場合、回答の内容が大きく異なってしまいました。PromptStadio側でバックエンド側で行っている処理とノートブック側で行っている処理の差異についてお聞…
    Answered
    Started by k_hanai
    Most recent by tomob
    0
    1
    Last answer by
  • 現在Snowpark上で動作する分析ツールとの連携をかんがえております。 Snowpark上にDataiku環境を構築することは可能なのでしょうか? 別途構築したDataiku環境からSnowparkへの連携についてはドキュメントや記事等みかけたのですが、Snowpark上に環境構築する方法や事例などはざっと見た感じ見受けられませんでした。 構築の可否と、可能であれば制約事項等含む手順をお教えいた…
    Answered
    Started by Satoshi_NES
    Most recent by Tsuyoshi
    0
    1
    Last answer by
  • Dataiku上での画像処理についていくつか質問があります。 1.画像フォルダにある画像ファイル名の変更の仕方 画像フォルダにある画像ファイル名を任意の条件、例えばok.pngで始まる画像ファイル名以外のものをng.pngにファイル名を一括で変換するにはpython recipeで実装するしかないのでしょうか。また、その時読み込むフォルダとファイルのパスはどこを参照すればいいでしょうか 2.前処理…
    Started by Koji
    Most recent by NaoYamaguchi
    0
    5
    Last answer by
  • AMLの不正取引検知を行うフローを検討しております。複数ユーザーのアクション履歴を元にした学習モデルではなく、顧客個別のデータを学習に利用して顧客ごとの不正を検知するようなユースケースはございますでしょうか。
    Answered
    Started by hikaru
    Most recent by Tsuyoshi
    0
    2
    Last answer by
  • https://academy.dataiku.com/page/partners 上記のサイトを確認したところ、サイト内容の更新中のようですが、現在はSellerの資格取得はできないのでしょうか。
    Answered ✓
    Started by HiroshiKawasaki
    Most recent by Tsuyoshi
    0
    1
    Solution by
  • GCP環境で立ち上げたDataiku cloudでsparkを使おうとするとエラーが出てしまいます。 ドキュメントにはDataiku cloudではデフォルトでSparkが使えると書いてあるのですがPysparkレシピを実行すると画像のようなエラーが出ます。何か設定をする必要があるのでしょうか。 (globalのほうで質問をしてしまったのですが日本コミュニティのほうに再度質問させていただきます。失…
    Answered
    Started by 尚矢
    Most recent by Tsuyoshi
    0
    3
    Last answer by
  • 【オンライン開催】 2月18日(火)18:00~20:00 ECサイトのデータを使ったレビュー分析をハンズオン形式で実施します!! レビュー分析に興味がある方必見! Dataikuを使ったレビュー分析を実際に操作しながら学ぶことができます。 初心者の方でも安心して参加できる内容になっていますので、 Dataikuを始めたばかりの方や、レビュー分析に興味があるけれどまだやったことがない方もご気軽にご…
    Started by 優樹
    1
  • 2025年2月13日開催の「Dataiku LLMハンズオン体験会」のデータは、本ページ下部からダウンロードしてください。 LLMハンズオン.zipファイルの中身として、「Hotel_review.csv」と「プロンプトテキスト.txt」を格納しております。 利用データとしてHotel_review.csv、ハンズオン内で利用するプロンプトのコピペ用にプロンプトテキスト.txtを用意しておりますの…
    Started by Fumihiko
    0
  • AuroraDBからデータセットを取得していますが、そのテーブルには直近4か月分のデータのみ含まれています。 しかし、データ分析を行う際に、4か月以上過去データも必要となり、対象テーブルからのデータセットを取得するたびに、別のデータセットとして累積する必要があります。 また、その際、同時に重複を排除する必要があります。 フロー上で上記の要件を満たすような方法がございましたら、教えていただけますと幸…
    Answered
    Started by Ryosuke
    Most recent by Tsuyoshi
    0
    1
    Last answer by
1 - 10 of 1221