Reunion

jeanphilippe
jeanphilippe Registered Posts: 1 ✭✭✭

J'ai 2 colonnes: une colonne email et une autre date. Lorsque le client passe un ordre d'achat avec 3produits différents dans son panier 3 lignes lui sont accordées avec le même email et la même date sur les 3lignes.Comment réunir ces 3lignes en une seule ligne et avec la même date?

Answers

  • tgb417
    tgb417 Dataiku DSS Core Designer, Dataiku DSS & SQL, Dataiku DSS ML Practitioner, Dataiku DSS Core Concepts, Neuron 2020, Neuron, Registered, Dataiku Frontrunner Awards 2021 Finalist, Neuron 2021, Neuron 2022, Frontrunner 2022 Finalist, Frontrunner 2022 Winner, Dataiku Frontrunner Awards 2021 Participant, Frontrunner 2022 Participant, Neuron 2023 Posts: 1,598 Neuron
    edited July 17

    @jeanphilippe

    Welcome to the Dataiku community.

    From you note here I’m not clear if you are trying to put all of the data on the same row / line because you are trying to create a machine learning model or for some other reason. So, I’m going to provide several suggestions.

    1. Take a look at the window or group by visual recipes. These will allow you to summarize the individual line items in the order. I particularly like the window recipe because I can keep the same number of lines in my data set that I started with.

    2. Depending on the number of different products you work with, the pivot recipe would allow you to create one column for each type of produce. For example total number of each type of product purchased. Caution is advised, this could create a large number of columns depending on the number of different type of products. Often categorizing the products first and the pivoting the categories is more manageable.

    3. Finally depending on the data storage you are using a particular column can contain a json array. In this case the one cell could contain all of the original data for your product line items.

    I’m sorry I don’t speak French, but I’ll include a google translate below. I hope this is of some help.

    Bienvenue dans la communauté Dataiku.
    
    D'après vous, je ne sais pas si vous essayez de mettre toutes 
    les données sur la même ligne / ligne parce que vous essayez
    de créer un modèle d'apprentissage automatique ou pour une autre
    raison. Je vais donc vous proposer plusieurs suggestions. 1. Jetez un œil à la fenêtre ou groupez par recettes visuelles.
    Celles-ci vous permettront de résumer les articles de la commande.
    J'aime particulièrement la recette de la fenêtre car je peux
    conserver le même nombre de lignes dans mon ensemble de données
    avec lequel j'ai commencé. 2. Selon le nombre de produits différents avec lesquels vous travaillez,
    la recette pivot vous permettrait de créer une colonne pour chaque
    type de produit. Par exemple le nombre total de chaque type de produit
    acheté. La prudence est recommandée, cela pourrait créer un grand
    nombre de colonnes en fonction du nombre de types de produits
    différents. Il est souvent plus facile de catégoriser les produits
    en premier et de faire pivoter les catégories. 3. Enfin, selon le stockage de données que vous utilisez, une
    colonne particulière peut contenir un tableau json. Dans ce cas,
    la cellule peut contenir toutes les données d'origine de vos éléments
    de ligne de produits. Je suis désolé de ne pas parler français, mais je vais inclure
    un google translate ci-dessous. J'espère que cela vous aidera.

Setup Info
    Tags
      Help me…