Passez à l’ère du raisonnement : découvrez le Reinforcement Learning

Cette présentation explore l’usage du Reinforcement Learning pour transformer les modèles d’IA en systèmes capables d’apprendre par essais, erreurs et retours utilisateurs. Elle détaille les algorithmes, frameworks comme NeMO RL, et les méthodes de réentraînement à grande échelle sur GPU ou TPU pour améliorer performance et efficacité.

talk.summaryAiDisclaimer

Laurent GrangeauGoogle

Tony JarriaultCAPGEMINI

talks.description

Les systèmes d’intelligence artificielle ne sont plus que de simples chatbots qui se contentent de parler, mais sont devenus des systèmes qui pensent, réagissent et prennent des décisions.
Dans ce nouveau monde, le Reinforcement Learning s’impose comme la technique qui permet à des modèles peu performants de s’améliorer sans compromis sur la performance et le coût par token.
Grâce au Reinforcement Learning, les modèles sont capables de se réentrainer pour devenir plus efficaces par essais et erreurs ou par retours utilisateurs.
Venez découvrir les algorithmes mis en œuvre pour le réentrainement et comment mettre en œuvre ce renforcement grâce à des frameworks comme NeMO RL. Vous verrez aussi comment réentrainer ces modèles à l’échelle sur GPU ou TPU.

algorithmes

reinforcement

learning

réentrainement

talks.speakers

Laurent Grangeau

Google

France

I am a Cloud Solution Architect at Google with over 10 years of experience. Formerly a Java developer, I have since evolved into .NET, Agile, and DevOps mindsets. I have been experimenting with cloud providers for over 5 years. A Docker enthusiast from the beginning, I specialize in building microservices and distributed systems. I love automating workflows and running distributed applications at scale.

Tony Jarriault

CAPGEMINI

France

Depuis mes premier pas en informatique, j'ai toujours été fasciné par les enjeux liés à la sécurité numérique, je suis également cloud addict. Le cloud nous apporte une très grande agilité, pour nous donner accès à l’innovation !

Responsable technique pour le build et le run de plateformes infogérées, j'ai participé au coaching d'équipes sur le volet technique, ce qui me permet de présenter les sujets qui me passionnent lors d’événements publiques (Ex : Devoxx / DevFest / ..)
Aujourd'hui, j'accompagne les clients dans l'adoption du cloud publique, que ce soit pour des applications B2C ou B2B qui doivent relever les challenges suivants : Securité / Finops / Green afin de limiter l'empreinte carbone des applications.