Conference45min
Une approche bottom-up pour la construction d'une taxonomie produit
Mirakl conçoit une taxonomie produit émergente à partir des données réelles plutôt qu’imposée. En combinant embeddings et LLMs, les produits se regroupent automatiquement en catégories spécifiques à chaque domaine, garantissant couverture et pertinence. Le talk détaille l’architecture et les avantages de cette approche bottom-up multi-industries.
talk.summaryAiDisclaimer
Robin VaysseMirakl
talkDetail.whenAndWhere
Wednesday, April 22, 13:30-14:15
Paris 242AB
Chez Mirakl, nous alimentons des centaines de marketplaces couvrant des industries très diverses, allant de l'électronique à des secteurs B2B comme des pièces aéronautiques. Chacune possède sa taxonomie, et aucun standard ne peut capturer cette diversité.
Concevoir une taxonomie selon une approche top-down impose des choix structurants : quel niveau de granularité adopter ? Comment garantir la couverture ? Ces décisions conduisent souvent à une taxonomie trop large dans certains domaines et incomplète dans d'autres.
Nous avons donc adopté une approche bottom-up, où la taxonomie émerge de millions de produits. En combinant embeddings de produits et LLMs, nous regroupons automatiquement les produits pour créer des catégories adaptées à chaque domaine. Résultat : si un produit existe, il trouve sa catégorie. Ces regroupements nous permettent aussi d'identifier les attributs les plus pertinents pour chaque catégorie en agrégeant ceux observés dans les produits.
Dans ce talk, nous présenterons l'architecture et les choix techniques derrière cette méthode, et pourquoi l'approche bottom-up est particulièrement adaptée pour créer une taxonomie couvrant de multiples industries.
Concevoir une taxonomie selon une approche top-down impose des choix structurants : quel niveau de granularité adopter ? Comment garantir la couverture ? Ces décisions conduisent souvent à une taxonomie trop large dans certains domaines et incomplète dans d'autres.
Nous avons donc adopté une approche bottom-up, où la taxonomie émerge de millions de produits. En combinant embeddings de produits et LLMs, nous regroupons automatiquement les produits pour créer des catégories adaptées à chaque domaine. Résultat : si un produit existe, il trouve sa catégorie. Ces regroupements nous permettent aussi d'identifier les attributs les plus pertinents pour chaque catégorie en agrégeant ceux observés dans les produits.
Dans ce talk, nous présenterons l'architecture et les choix techniques derrière cette méthode, et pourquoi l'approche bottom-up est particulièrement adaptée pour créer une taxonomie couvrant de multiples industries.
