Data & AIConference45min
IA en Production : Servir des modèles d'IA avec performance et scalabilité
Découvrez comment adapter le déploiement de modèles d'IA avec KServe pour des cas e-commerce à basse latence et Multi-LoRA sur Anyscale pour la transformation de catalogues à volume élevé. Cette présentation explore les défis techniques, les choix de solutions et les enseignements pour optimiser l'orchestration des modèles en production.
Yannick LambruschiMirakl
Luis BlancheMirakl
talkDetail.whenAndWhere
Thursday, April 17, 13:30-14:15
Paris 143
Les différents cas d’usages de modèles d’IA et de GenAI en production sont sujets à des contraintes de déploiement spécifiques qui nécessitent des approches adaptées. Par exemple, pour un cas d’usage e-commerce basse latence, nous avons déployé nos modèles sur KServe, une solution cloud-native qui exploite Kubernetes pour permettre une colocalisation efficace et optimiser les coûts. À l’opposé, pour un cas d’usage de transformation de catalogues avec des modèles LLM fine-tunés, nous avons réussi à intégrer une architecture Multi-LoRA sur Anyscale grâce à RayLLM, répondant à des besoins de traitement à haut volume avec coût maîtrisé.Cette présentation abordera ces deux approches distinctes en mettant en lumière les défis techniques, les critères de choix des solutions et les enseignements tirés pour optimiser le déploiement et l’orchestration de modèles d’IA selon leurs contraintes spécifiques en production
Yannick Lambruschi
I'm a Senior ML Data Engineer with a passion for building scalable data systems and driving machine learning solutions into production. With extensive experience in data engineering, Feature store, and cloud technologies, I enjoy sharing insights and best practices about data pipelines, ML workflows, and emerging trends in data and machine learning. Whether it's automating deployments, optimizing big data performance, or exploring new tools in the ML ecosystem, I'm dedicated to helping others navigate the ever-evolving world of data and AI.
comments.speakerNotEnabledComments