Reunion

jeanphilippe
Level 1
Reunion

J'ai 2 colonnes: une colonne email et une autre date. Lorsque le client passe un ordre d'achat avec 3produits différents dans son panier 3 lignes lui sont accordées avec le même email et la même date sur les 3lignes.Comment réunir ces 3lignes en une seule ligne et avec la même date?

0 Kudos
1 Reply
tgb417

@jeanphilippe 

Welcome to the Dataiku community.  

From you note here I’m not clear if you are trying to put all of the data on the same row / line because you are trying to create a machine learning model or for some other reason.  So, I’m going to provide several suggestions.

1. Take a look at the window or group by visual recipes.  These will allow you to summarize the individual line items in the order.  I particularly like the window recipe because I can keep the same number of lines in my data set that I started with.  

2. Depending on the number of different products you work with, the pivot recipe would allow you to create one column for each type of produce.  For example total number of each type of product purchased.  Caution is advised, this could create a large number of columns depending on the number of different type of products.  Often categorizing the products first and the pivoting the categories is more manageable.

3. Finally depending on the data storage you are using a particular column can contain a json array.  In this case the one cell could contain all of the original data for your product line items.

I’m sorry I don’t speak French, but I’ll include a google translate below.  I hope this is of some help.

Bienvenue dans la communauté Dataiku.

D'après vous, je ne sais pas si vous essayez de mettre toutes 
les données sur la même ligne / ligne parce que vous essayez
de créer un modèle d'apprentissage automatique ou pour une autre
raison. Je vais donc vous proposer plusieurs suggestions. 1. Jetez un œil à la fenêtre ou groupez par recettes visuelles.
Celles-ci vous permettront de résumer les articles de la commande.
J'aime particulièrement la recette de la fenêtre car je peux
conserver le même nombre de lignes dans mon ensemble de données
avec lequel j'ai commencé. 2. Selon le nombre de produits différents avec lesquels vous travaillez,
la recette pivot vous permettrait de créer une colonne pour chaque
type de produit. Par exemple le nombre total de chaque type de produit
acheté. La prudence est recommandée, cela pourrait créer un grand
nombre de colonnes en fonction du nombre de types de produits
différents. Il est souvent plus facile de catégoriser les produits
en premier et de faire pivoter les catégories. 3. Enfin, selon le stockage de données que vous utilisez, une
colonne particulière peut contenir un tableau json. Dans ce cas,
la cellule peut contenir toutes les données d'origine de vos éléments
de ligne de produits. Je suis désolé de ne pas parler français, mais je vais inclure
un google translate ci-dessous. J'espère que cela vous aidera.

 

--Tom