Arquivos Feather - Apache Arrow e Conceitos

preview_player
Показать описание
💜 Falamos um pouco mais sobre os concetiso do Feather e como é o Apache Arrow, projeto que deu origem a esse tipo de arquivo.

---------

Leon Sólon é bacharel em Ciência da Computação e mestre em Ciência de Dados pela Universidade de Brasília - UnB. Possui mais de 20 anos de experiência na área de TI e mais há mais de 5 anos como cientista de dados. Atualmente é Auditor-Fiscal da Receita Federal (atuando como cientista de dados) e cientista de dados da startup Bludworks.

----------

📸 @leon_solon @felipeschiavon @bernardolago

🐦 @leonsolon @felipeschiavon @bernardolago

----------

Ouça nosso podcast nos principais players:

#python #datascience
Рекомендации по теме
Комментарии
Автор

Segundo o Wes McKinney, o Feather ele é uma cópia bruta do que tá alocada na memória, e o maior ganho que você possui é justamente o que você falou de não ter serialização (propriamente dita) então feather ganha muito tempo de leitura e de escrita, porém eles consideram que pra armazenamento o parquet é meio que o "optimal type" por ordenar nativamente os vetores fazendo que as compressões sejam otimizadas. Parabéns pelo trabalho. :)

igormriegel
welcome to shbcf.ru