Sous le capot des LLMs : toutes ces questions que vous n’avez jamais osé poser

Ce texte explore les mystères des modèles de langage (LLMs) à travers une série de questions fréquemment posées par les développeurs. La présentation aborde les tokens, les limites en mathématiques, les différences entre modèles pré-entraînés et fine-tunés, les hyperparamètres, et les imperfections telles que les hallucinations et la "reversal curse".

talk.summaryAiDisclaimer

Guillaume LaforgeGoogle

Didier GirardSFEIR

talkDetail.whenAndWhere

Wednesday, April 16, 11:35-12:20

Maillot

talks.description

Les LLMs ont pris d'assaut le monde au travers des chatbots, de la génération de contenu. Pourtant, ils restent énigmatiques.Cette présentation plongera dans les recoins cachés des LLMs qui laissent les développeurs perplexes. Il est temps de poser ces questions que vous n'avez jamais osé poser sur leurs mystères !Voici quelques questions auxquelles nous répondrons : - Pourquoi les LLM crachent des tokens au lieu de mots ? D'où viennent ces tokens ? - Pourquoi ne sont-ils pas toujours très intelligents en mathématiques ? - La différence entre un modèle "fondamental" / "pré-entraîné" et un modèle "fine-tuné" ? - Comment un modèle sait-il quand il a fini de répondre à votre question ? - Comment les hyperparamètres (température, top-p, top-k) affectent ils le choix des tokens ?- Saviez vous que les LLMs parlent le Base64 ?Mais les LLM sont loin d'être parfaits : - Quid des hallucinations ?- Qu'est-ce que la “reversal curse” qui fait que les LLM ignorent certains faits d'un point de vue différent ? - Les LLMs sont ils déterministes à basse température ? En tout cas, ils sont influençables.Nous répondrons ensemble à ces questions et dévoilerons les mystères des LLMs !

nouvelle

presentation

talks.speakers

Guillaume Laforge

Google

France

Guillaume Laforge est développeur advocate chez Google Cloud où il se focalise autour des sujets d'IA générative, de solutions serverless, d'architecture distribuée et d'automatisation des APIs. Guillaume est également Java Champion, un des membres fondateurs du podcast Les Cast Codeurs et est le co-fondateur du langage de programmation Apache Groovy.

Didier Girard

SFEIR

France

Didier Girard is a technology expert. He obtained a PhD in the field of AI and is recognized in the field of cloud and IS architecture.
He currently holds the position of Managing Director of SFEIR and WENVISION. SFEIR is a company specialized in building modern information systems, while WENVISION is a technology strategy consulting firm.