Data & AIData & AI
Tools-in-Action30min
INTERMEDIATE

Spark 4 et Iceberg, le nouveau standard pour tous vos projets Data

Ce texte présente Spark 4 et Apache Iceberg comme le nouveau standard pour les projets data modernes. Il met en avant les améliorations de Spark 4 en performance et gestion des lacs de données, ainsi qu'Apache Iceberg pour sa gestion avancée des données. Des démonstrations pratiques illustrent l'implémentation de pipelines performants et scalables.

Pierre Andrieux
Pierre AndrieuxCapgemini
Houssem Chihoub
Houssem ChihoubDatabricks

talkDetail.whenAndWhere

Thursday, April 17, 17:00-17:30
Neuilly 151
talks.description
La révolution du traitement des données est en marche avec l'arrivée de Spark 4 et Apache Iceberg ! Cette présentation vous démontrera comment cette combinaison technologique devient rapidement le nouveau standard incontournable pour les projets data modernes.Au programme :Les nouveautés majeures de Spark 4 : découvrez les améliorations significatives en termes de performances, notamment avec le nouveau moteur de requêtes, le support natif des lacs de données et l'optimisation automatique des requêtes.Apache Iceberg démystifié : plongez dans cette table format nouvelle génération qui révolutionne la gestion des données dans les lacs de données. Nous aborderons ses fonctionnalités clés comme le Time Travel, le Schema Evolution et le partitionnement dynamique.Cas d'usage concrets : à travers des démonstrations pratiques, nous verrons comment implémenter un pipeline de données moderne combinant ces technologies, avec un focus particulier sur les bonnes pratiques et les pièges à éviter.Performance et scalabilité : découvrez comment cette stack permet d'obtenir des performances exceptionnelles même sur des volumes de données massifs, tout en maintenant une cohérence ACID.
données
spark
performances
iceberg
talks.speakers
Pierre Andrieux

Pierre Andrieux

Capgemini

France

Pierre Andrieux est Architecte Solutions au sein de Capgemini. Passionné par les nouvelles technologies et le craftsmanship, Pierre a eu l’occasion de développer son expertise sur le E-commerce, la Data et le Cloud. Riche de son expérience chez un intégrateur, un éditeur et un client final, Pierre partage ses découvertes en contribuant activement à l'animation d'une des plus grandes communautés de Software Engineer de France.
Houssem Chihoub

Houssem Chihoub

Databricks

France

Houssem est Solutions Architect chez Databricks, passionné par la data, l'IA et les technologies émergentes. Il détient un doctorat en gestion de données dans le cloud et a développé une expertise solide à travers ses expériences chez AWS et d'autres acteurs majeurs dans l'industrie.
comments.title

comments.speakerNotEnabledComments