Introdução ao Pandas (curso Python para Machine Learning - Aula 12)

preview_player
Показать описание
Nesse vídeo iremos mostrar como usar o pacote Pandas em Python. Esse pacote será muito útil para criar dataframes, abrir arquivos, manipular os dados e posteriormente rodar algoritmos de machine learning.
Resumo dessa aula:
0:38 O que é um dataframe
0:58 Importando o pandas como pd (import pandas as pd)
4:33 Transformando um dicionário em um dataframe com o comando pd.DataFrame
6:02 Índices do dataframe
7:50 Criando um objeto do tipo Series com o comando pd.Series
8:45 O que é um vetor Series e sua diferença para um array do Numpy
12:12 Transformando um array numpy em um objeto Series do pandas
13:50 Prova de que um objeto Series é unidimensional
14:12 Qual a utilidade de um objeto Series (é um dataframe de uma coluna só)
O pacote Pandas, sem dúvida, será um dos mais utilizados no estudo de machine learning e ciência de dados, pois ele transforma os dados que estão em seu computador em planilhas fáceis de se manipular. Nas próximas aulas, veremos como é fácil tratar os dados de um dataframe para, posteriormente, aplicar um algoritmo de machine learning nesses dados.

Рекомендации по теме
Комментарии
Автор

Olá pessoal! Liberamos CERTIFICADO para este curso gratuito.
Para solicitar o seu, basta conferir o curso no link abaixo:

Автор

Bom dia! Estou aqui passando humildemente para agradecer a você e toda sua equipe, por liberar essas aulas. estou desempregado, na luta por um emprego e resolvi estudar para tentar uma oportunidade como Cientista de dados e só encontrava cursos pagos e extremamente caros e no momento não tenho condições para pagar um. Que Deus abençoem vocês e assim que eu terminar essas aulas e a de Machie Learning, vou me candidatar a vagas para iniciantes e se Deus quiser eu conseguindo, eu retorno para compartilha esta vitória com vocês. Gratidão!

paulorogerio
Автор

Mano, como pode um conteúdo tão bom assim ser gratuito? Muito obrigado pelos vídeos!

MathematikO
Автор

meus parabéns: Deus abençoa muito voce e sua equipe. Show não tinha visto ninguém explicar assim.

claudimilsonnilsonbonfim
Автор

Parabéns pelo conteúdo . Pergunto se você pode pegar uma tabela presente em um sistema web sem ter que importar ela com csv ou Excel... apenas trazer o df e colocar em uma variável... obrigado.

IedoBrito
Автор

Parabéns pelos vídeos, excelente canal!

victorhugoovanimarchetti
Автор

O conteúdo do canal é sensacional, muito obrigado, tem me ajudado muito!
Só uma ideia, e se pra cada aula, ou conjunto de aulas tivessem alguns exercícios pra ajudar a fixar os conceitos?

felipemahlow
Автор

Bom dis a Todos, inicialmente quero parabeniza-lo pelo otimo conteudo, estou fazendo Esses mesmos passos no dia de hoje 7 jun 2021. E quando rodo:

object2 = pd.Series(array2)
print (object2)

Result:

0 (6, 13, 4, 0, 15)
1 (13, 9, 7)

Inclusive a expressao para array tbm mudou, creio que seja por conta das atualizacoes, entao isso quer dizer que agora o commando Series nao eh mais unidimensional?

MarcelForsett
Автор

Olá Natanael, gostaria de saber quais formas de contato estão disponíveis para tirar dúvidas referentes ao curso completo que você entrega no Didatica Tech?

erosgkm
Автор

Cara, muito boa sua didática. Parabéns.
Tive um pequeno probleminha... quando fui tentar usar a função .Series em um array tive um erro, "Os dados devem ser unidimensionais". Segue o código:

import numpy as np
array1 = np.array([(2, 6, 9, 10, 8)])
array2 = np.array([(2, 6, 9, 11, 23), (10, 5, 8, 21, 11)])
print(array1)
print(array2)


objeto2 = pd.Series(array1)
print(objeto2)


Erro: Exception: Data must be 1-dimensional

edneymatheus
Автор

Cara, que didática viu! Tem canal no telegram?

mardemes
Автор

caso ERRO
dataframe = pd.DataFrame.from_dict(alunos, orient='index')
dataframe.transpose()

luancarvalho
Автор

O pd é padrão ou posso colocar as letras que eu quiser?

vagner_pereira
Автор

fala pessoal estou tentando rodar o programa aqui na minha maquina mas me mostra esse erro!
AttributeError: module 'pandas' has no attribute 'Dataframe'
ja tentei mudar o nome do file e mesmo assim nada muda, alguém pode me ajudar por favor.
abraco a todos

luccatavares
Автор

Estou usando o VS Code.. Até este exercício, deu certo.. Mas esse não está conseguindo importa o Pandas...
Alimentei as Extensions com Anacinda, Azure... Mas o pd. DataFrame, não está sendo reconhecido como módulo válido

relvascaue
Автор

Se eu crio uma serie dessa forma ele ira printar uma coluna ao lado da outra, isso não seria uma serie bidimensional?

series2 = pd.Series([12, 2, 3, 36], [8, 63, 5, 54])
print(serie2)
>>>
8 12
63 2
5 3
54 36
dtype: int64

jpedros
Автор

Olá professor, poderia me ajudar?
Coloco o código e quando aperto run ele diz “ “ “ modulenotfounderror: No module named ‘panda’ “
Segue o código:
Import pandas as pd
Alunos = {‘Nome’:[‘Caio’, ‘Bruno’, ‘José’, ‘Jacson’],
‘Nota’:[4, 5, 7, 9],
‘Aprovado’:[‘não’, ‘não’, ‘sim’, ‘sim’]}

Não dá dando bom :(

fernandasantana
Автор

Puta merda 4 mil páginas de documentação para uma única biblioteca. 29 - 01 - 21

LofilabLofiHipHop
Автор

Porque o meu programa não deu certo?
import numpy as np
array1 = np.Array([2, 6, 8, 2, 12])
array2 = np.Array([(2, 6, 8, 2, 12), (2, 6, 8, 2, 12)])
print(array1)
print(array2)

Brazilianknight
Автор

Ao digitar dataframe = pd.DataFrame(alunos), me apareceu essa mensagem:



ValueError Traceback (most recent call last)
in <module>
----> 1 dataframe = pd.DataFrame(alunos)


in __init__(self, data, index, columns, dtype, copy)
390 dtype=dtype, copy=copy)
391 elif isinstance(data, dict):
--> 392 mgr = init_dict(data, index, columns, dtype=dtype)
393 elif isinstance(data, ma.MaskedArray):
394 import numpy.ma.mrecords as mrecords


in init_dict(data, index, columns, dtype)
210 arrays = [data[k] for k in keys]
211
--> 212 return arrays_to_mgr(arrays, data_names, index, columns, dtype=dtype)
213
214


in arrays_to_mgr(arrays, arr_names, index, columns, dtype)
49 # figure out the index, if necessary
50 if index is None:
---> 51 index = extract_index(arrays)
52 else:
53 index = ensure_index(index)


in extract_index(data)
315 lengths = list(set(raw_lengths))
316 if len(lengths) > 1:
--> 317 raise ValueError('arrays must all be same length')
318
319 if have_dicts:


ValueError: arrays must all be same length

JamesBomdePapo