Data & AnalyticsData & Analytics
Tools-in-Action30min
INTERMEDIATE

Polars, la fin de Spark ?

Vous devez choisir quelle technologie utiliser pour traiter des dizaines, voir des centaines de Go de données. L'éléphant dans la pièce c'est Spark, qui a largement fait ses preuves. Un éléphant tellement gros que vous ne voyez rien d'autre.

Je vais vous convaincre d'abandonner Spark pour faire du Polars. Cette présentation propose une comparaison directe entre Apache Spark et Polars, mettant en évidence les avantages de performance, de simplicité d'utilisation et d'efficacité de Polars par rapport à Spark pour le traitement de données. L'objectif est de démontrer pourquoi Polars pourrait représenter l'avenir du traitement de données, offrant une alternative moderne et performante à l'écosystème Spark traditionnel.

franck cussac
franck cussacHymaïa

talkDetail.whenAndWhere

Friday, April 24, 17:00-17:30
TBA 6
talks.roomOccupancytalks.noOccupancyInfo
talks.description
Vous devez choisir quelle technologie utiliser pour traiter des dizaines, voir des centaines de Go de données. L'éléphant dans la pièce c'est Spark, qui a largement fait ses preuves. Un éléphant tellement gros que vous ne voyez rien d'autre.

Je vais vous convaincre d'abandonner Spark pour faire du Polars. Cette présentation propose une comparaison directe entre Apache Spark et Polars, mettant en évidence les avantages de performance, de simplicité d'utilisation et d'efficacité de Polars par rapport à Spark pour le traitement de données. L'objectif est de démontrer pourquoi Polars pourrait représenter l'avenir du traitement de données, offrant une alternative moderne et performante à l'écosystème Spark traditionnel.
données
polars
performance
spark
talks.speakers
franck cussac

franck cussac

Hymaïa

France

Actuellement, chez Hymaïa depuis avril 2022, Franck occupe le poste de Data Engineer et Formateur. Dans ce rôle, il est responsable de la conception, du développement et de la maintenance des pipelines de données, ainsi que de la formation des équipes sur les meilleures pratiques en matière de data engineering.

talkDetail.rateThisTalk

talkDetail.poortalkDetail.excellent

talkDetail.ratingNotYetAvailable

talkDetail.ratingAvailableWhenStarted

talkDetail.signInRequired

talkDetail.signInToRateDescription

occupancy.title

occupancy.votingNotYetAvailable

occupancy.votingAvailableBeforeStart

talkDetail.signInRequired

occupancy.signInToVoteDescription

comments.title

comments.speakerNotEnabledComments