Data & AIData & AI
Conference45min
INTERMEDIATE

La recherche à l'ère de l'IA

This conference explores the limitations of traditional "Classic" search approaches based on term frequency (TF/IDF or BM25), and focuses on the current trend of machine learning models. It demonstrates how to use vector search or hybrid search in Elasticsearch and showcases the integration of OpenAI's ChatGPT and other large language models with Elastic. The main demo showcases generating embeddings from music and finding the most similar song to a hummed melody. State-of-the-art techniques such as BM25, vector search, embeddings, hybrid search, Reciprocal Rank Fusion, and OpenAI integration are covered.

David Pilato
David PilatoElastic

talkDetail.whenAndWhere

Thursday, April 18, 11:35-12:20
Paris 141
talks.description
La recherche ne se contente plus de l'approche maintenant traditionnelle basée sur la fréquence des termes (TF/IDF ou BM25) mais plus sur la tendance actuelle du machine learning où les nouveaux modèles ont ouvert une nouvelle dimension pour la recherche.
Cette conférence donne un aperçu de :
  • La recherche "Classique" et ses limitations
  • Qu'est qu'un modèle de machine learning et comment vous pouvez l'utiliser
  • Comment utiliser la recherche vectorielle ou la recherche hybride dans Elasticsearch
  • Comment ChatGPT d'OpenAI ou les "large language models" (LLMs) similaires viennent jouer naturellement avec Elastic
Cette session couvre l'état de l'art en matière de recherche de nos jours : BM25, recherche vectorielle, embeddings, recherche hybride, Reciprocal Rank Fusion, intégration avec OpenAI... La démo principale montre comment générer des embeddings à partir de musiques puis comment trouver la musique qui s'approche le plus d'une musique que nous fredonnons.
recherche
recherche vectorielle
recherche hybride
elasticsearch
modèles
bm25
modèles de machine learning
machine learning
talks.speakers
David Pilato

David Pilato

Elastic

France

Depuis 2013, David Pilato est développeur et évangéliste chez elastic.co, après avoir passé les deux années précédentes à promouvoir le projet open-source Elasticsearch. Il en anime la communauté française et organise des BBLs au sein des entreprises. Egalement auteur du projet FSCrawler qui permet d'indexer des documents pdf, open office, etc. dans elasticsearch en utilisant Apache Tika.
comments.title

comments.speakerNotEnabledComments