AI & Agentic SystemsAI & Agentic Systems
Conference45min
INTERMEDIATE

Mesurer l’immesurable : Comment évaluer les systèmes à base d’IA générative ?

Cette session présente les défis d’évaluation des systèmes génératifs, conciliant créativité et fiabilité. À travers le cas d’un chatbot RAG, elle détaille méthodes, critères, limites des métriques classiques, rôles de l’automatisation et de l’humain, et propose un pipeline reproductible pour maîtriser et valoriser l’usage des LLM.

Erin Pacquetet
Erin PacquetetSCIAM

talkDetail.whenAndWhere

Wednesday, April 22, 10:30-11:15
TBA 5
talks.roomOccupancytalks.noOccupancyInfo
talks.description
Les IA génératives révolutionnent la création d’applications, ouvrant des usages variés : assistants, génération de contenu, recherche augmentée, et facilitant des tâches complexes. Mais un défi majeur subsiste : évaluer précisément des produits basés sur des modèles à la fois créatifs et imprévisibles.
Cette session explore ce paradoxe : exploiter les LLM tout en maîtrisant l’évaluation de leurs résultats. Nous verrons comment ajuster critères et méthodes pour évaluer exactitude technique, cohérence et pertinence métier. Au programme : limites des métriques classiques, évaluation automatisée via “LLM-as-a-judge” (et ses biais), importance de l’évaluation humaine, et suivi continu pour détecter dérives et effets secondaires.
Nous analyserons le cas d’un chatbot RAG, où créativité linguistique et exigence de vérité s’opposent. L’évaluation, équilibre de factualité et fluidité, contrôle la précision sans maîtriser la question posée. Ce cas concret nous servira de fil rouge pour voir comment implémenter un pipeline d'évaluation complet et reproductif.
Cette session offre des repères et outils pour évaluer méthodiquement les systèmes génératifs et en faire un atout stratégique en IA.
llm
créativité
métriques
évaluation
talks.speakers
Erin Pacquetet

Erin Pacquetet

SCIAM

France

Erin Pacquetet est data scientist senior chez SCIAM, où elle conçoit et industrialise des solutions d’IA autour du NLP, des LLM et des chatbots RAG pour des cas d’usage concrets en entreprise. Passionnée par le lien entre linguistique et informatique pour des solutions créatives aux problèmes réels, elle transforme avec expertise des problématiques produits en architectures IA robustes, évaluables et accessibles aux équipes dev comme aux métiers.

Elle possède une expertise approfondie couvrant la conception et optimisation de prompts, la gestion avancée des pipelines de données, l’évaluation rigoureuse des modèles, ainsi que l’intégration et la mise en production de solutions IA industrielles.

Parallèlement, elle reste active en recherche scientifique et en outreach, notamment sur des sujets comme l'analyse des modèles IA, l’intégration pragmatique de l’IA en dev, et l’interaction humain-machine via le langage, qu’elle partage régulièrement en meetups et conférences depuis plusieurs années.

talkDetail.rateThisTalk

talkDetail.poortalkDetail.excellent

talkDetail.ratingNotYetAvailable

talkDetail.ratingAvailableWhenStarted

talkDetail.signInRequired

talkDetail.signInToRateDescription

occupancy.title

occupancy.votingNotYetAvailable

occupancy.votingAvailableBeforeStart

talkDetail.signInRequired

occupancy.signInToVoteDescription

comments.title

comments.speakerNotEnabledComments