Como manipular colunas com datas de um DataFrame Pandas | Dica de Pandas ep. 21

preview_player
Показать описание
Nesse vídeo, a Kizzy explora operações com datas em um conjunto de dados, utilizando a classe Datetime do Pandas. Enquanto trabalhamos com dados no Pandas, executamos uma vasta gama de operações nos dados para obtê-los na forma desejada. Uma dessas operações pode ser a conversão de tipo de colunas de um DataFrame do Pandas.

Sumário do vídeo:
0:00 Tema do vídeo
0:22 Apresentação
0:35 O que é Dica de Pandas?
0:48 Comentário que motivou o vídeo
02:03 O que é o Kaggle?
02:15 Conjunto de dados utilizado no vídeo
03:05 Abrindo um conjunto de dados com Pandas - read_csv
03:45 método info( ) para ver tipos de dados das colunas
04:26 Operações com colunas
06:10 Convertendo uma coluna para Datetime - to_datetime( )
08:00 Operações com colunas Datetime
08:15 Gráficos com colunas data no Pandas
11:10 Coluna datetime como índice do Dataframe

Manipular linhas e colunas usando o Pandas é importante em diversas atividades dentro do trabalho de um analista de dados ou cientista de dados. Dentre elas:

– Exploração de Dados: tarefa crucial para entender a estrutura dos dados, identificar padrões, detectar valores ausentes e obter insights iniciais.
– Preparação de Dados: Ao selecionar as colunas relevantes, você pode criar subconjuntos focados de dados que são mais relevantes para a tarefa em questão. Além disso, Você pode filtrar, substituir, renomear, agregar e aplicar funções específicas às colunas escolhidas, tornando os dados mais preparados para análise. Isso ajuda a reduzir o ruído e melhorar a qualidade dos resultados.
– Análise Específica: Dependendo das perguntas que você está tentando responder, pode ser necessário focar em um subconjunto específico de dados. Selecionar apenas as colunas relevantes ajuda a evitar a sobrecarga de informações e a concentrar-se nas variáveis que importam para sua análise.
– Visualização: Ao selecionar as colunas de interesse, você pode criar visualizações mais claras e significativas dos dados. Isso permite que você comunique suas descobertas de maneira mais eficaz.
– Modelagem de Dados: Ao criar modelos de machine learning, é importante escolher as variáveis (colunas) relevantes para a previsão. A seleção cuidadosa das colunas pode melhorar a precisão e a generalização do modelo, além de reduzir a dimensionalidade desnecessária.

Links úteis:

Em programação de computadores, pandas é uma biblioteca de software criada para a linguagem Python para manipulação e análise de dados. Em particular, oferece estruturas e operações para manipular tabelas numéricas e séries temporais. É software livre sob a licença BSD.[2] O nome é derivado do termo inglês "panel data"(dados em painel), um termo usado em estatística e econometria para conjunto de dados que incluem várias unidades amostrais (indivíduos, empresas, etc) acompanhadas ao longo do tempo. Fonte: Wikipedia
#DicaPandas #Python

▶️ Assista também:

✉️ E-mails:

TikTok: @pgdinamica

📸 @kizzy_terra @hallpaz

🐦 @kizzy_terra @hallpaz

Рекомендации по теме
Комментарии
Автор

olá boa noite =) Desejo muito sucesso para vocês💟💟 A partir de ano que vem irei estudar para conseguir ingressar na graduação de Ciência de dados na UFMG (que será possível ingressar no enem deste ano) ou engenharia de sistema, contudo irei absorver o máximo deste canal para basear minha trajetória universitária e profissional 🤓 Espero construir muito conhecimento com vcs. Abraços

kennerjosedesouza
Автор

Legal as dicas, estou criando uma página com streamlit e me preocupo com como os dados são exibidos, no caso eu queria que exibisse em formato ptbr e ao mesmo tempo realizar operações. Se puder ajudar agradeço. Até

collaxd
Автор

Kizzy, olá :) deu erro de função no meu retorno, não consigo resolver, a função simplesmente não funciona aqui. Tem alguma ideia de como resolver?

nubiaalvarengaribeiro