Apache Parquet, c'est quoi ??

preview_player
Показать описание

Apache Parquet est un format de fichier très connu dans le stockage de la données et notamment pour le stockage en datascience. Dans ce tutoriel, nous allons découvrir ses particularités notamment pour ses performances en matière de compression et d'encodage.

En outre, nous abordons les fichiers parquet dans la playlist #clickhouse car ils font partie des formats supportés par clichouse. Parquet est utilisable par de nombreux outil tels que drill, duckdb, trino... Et ses capacités de compression et d'interrogation le rendre très pratique pour valoriser du stockage S3.

Sommaire de plus de 1500 vidéos :

➡️ ➡️ Vous voulez m'encourager likez la vidéo, commentez-là et abonnez-vous ! 😃
Рекомендации по теме
Комментарии
Автор

Merci pour cette vidéo très intéressante et pratique !

higiniofuentes
Автор

Intéressant! ! mais un peu plus compliqué qu'un fichier CSV

claude_c
Автор

Je ne savais pas que pandas pouvait être utilisé sans jupyter ou autres !

higiniofuentes
Автор

À la place de Marseille, il fallait mettre Orange comme ville ça aurait fait Caen Paris Orange (Campari orange). OK je sors 😅

mjcc_