Détail du talk

AI & ML Engineering

FR
EN
16h - 16h30
Salle Adenauer - 500 personnes

From Product Images to Structured Data: VLMs at Marketplace Scale

Les budgets GPU ne sont pas nécessairement proportionnels au nombre d'images traitées. Chez Mirakl, nous avons développé une architecture d'inférence native du cloud pour notre Catalog Transformer. Celle-ci traite les images de produits à grande échelle et extrait des informations structurées pour des cas d'utilisation en aval, comme le tri des images et la suppression de l'arrière-plan.

Les catalogues contenant des milliers de produits sont prétraités avec Apache Spark, puis diffusés via des modèles de langage visuel sur KServe avec un backend vLLM. Ils sont optimisés grâce à des LoRA finement paramétrés et leur coût est amorti par la mise en cache.

Nous détaillerons les composants essentiels que nous avons choisis et les compromis rencontrés en production, afin de proposer un modèle réutilisable par d'autres équipes. Nous conclurons en présentant deux piliers opérationnels pour la mise à l'échelle : la parallélisation et la régulation du trafic grâce à des files d'attente événementielles, et l'intégration d'une passerelle IA dans notre feuille de route. 

voir tous les talks

Tu veux participer en 2025 ? C'est le 24 novembre :

Devenez sponsor

bronze partner

2 invitations
Votre logo sur notre site, page Linkedin et les vidéos en replay
Likes et partages de vos propres posts

silver partner

4 invitations
Votre logo sur notre site, page Linkedin et les vidéos en replay
Short Youtube sous-forme de remerciement
Likes et partages de vos propres posts

gold partner

6 Invitations
Votre logo sur notre site, page Linkedin et les vidéos en replay
Short Youtube sous-forme de remerciement
Temps de parole sur la scène principale (5mn) ou table ronde (45mn) dans un de nos espaces dédiés (30 participants environ)
Liste des partcipants (conformité RGPD)
sponsoring