3H Deep Dive180min
Compose & Dragons: le jeu de rôle des agents nourris aux Tiny Language Models
Cette présentation démonte les idées reçues sur les très petits LLMs (<4B paramètres), montrant qu’ils sont capables de tâches variées. À travers la création d’un jeu de rôle textuel piloté par ces modèles, elle propose des méthodes et conseils pour concevoir des systèmes d’IA générative efficaces avec peu de ressources.
Guillaume LoursDocker
Philippe CharrièreDocker
Debunkons quelques croyances relatives aux (tout) petits LLMs, ceux qui font moins de 4b de paramètres. On entend souvent:
Ils sont inutiles et ne savent rien faire, ils ne connaissent rien, ils sont mauvais en function calling (donc pas de MCP)
C'est en partie faux, et on peut remédier au reste et construire des systèmes d'IA générative avec ces très petits modèles.
C'est ce que nous allons démontrer lors de cette université d'une façon ludique:
Nous avons utilisés les fonctionnalités d'IA de Docker, pour développer un jeu de rôle de type "dungeon crawler" (EN MODE TEXTE) avec des PNJ, des monstres, des jets de dés ... le tout piloté par des agents d'IA (codés from scratch par nos soins) qui utilisent uniquement de très petits modèles (comme par ex: Jan-nano-gguf 4b, qwen2.5 1.5b, granite-embedding 278m pour le RAG, ...)
Nous verrons entre autre comment créer des PNJ avec une personnalité, un dungeon master qui va gérer vos mouvements, combats ... et permettre de parler à tel ou tel PNJ ...
Alors, notre jeu n'est pas Diablo (mais il reste jouable), mais vous repartirez avec des recettes et des conseils réutilisables pour développer vos propres solutions avec des tout petits modèles.
Ils sont inutiles et ne savent rien faire, ils ne connaissent rien, ils sont mauvais en function calling (donc pas de MCP)
C'est en partie faux, et on peut remédier au reste et construire des systèmes d'IA générative avec ces très petits modèles.
C'est ce que nous allons démontrer lors de cette université d'une façon ludique:
Nous avons utilisés les fonctionnalités d'IA de Docker, pour développer un jeu de rôle de type "dungeon crawler" (EN MODE TEXTE) avec des PNJ, des monstres, des jets de dés ... le tout piloté par des agents d'IA (codés from scratch par nos soins) qui utilisent uniquement de très petits modèles (comme par ex: Jan-nano-gguf 4b, qwen2.5 1.5b, granite-embedding 278m pour le RAG, ...)
Nous verrons entre autre comment créer des PNJ avec une personnalité, un dungeon master qui va gérer vos mouvements, combats ... et permettre de parler à tel ou tel PNJ ...
Alors, notre jeu n'est pas Diablo (mais il reste jouable), mais vous repartirez avec des recettes et des conseils réutilisables pour développer vos propres solutions avec des tout petits modèles.
Philippe Charrière
Geek assumé et Solution Architect chez Docker le jour, dresseur de tiny LLMs la nuit. Convaincu que les meilleurs modèles tiennent en moins de 4B de paramètres et que Go est le langage des gens bien. Multiplie les side projects comme d'autres collectionnent les NFTs — mais en plus utile.
comments.speakerNotEnabledComments