Análise do Titanic - Parte 1 - Projeto de Ciência de Dados

preview_player
Показать описание
Quer saber mais sobre o nosso Curso Completo de Ciência de Dados? Clique no link abaixo para garantir sua vaga na próxima turma:

PARA BAIXAR O MINICURSO GRATUITO DE CIÊNCIA DE DADOS:

-----------------------------------------------------------------------

-----------------------------------------------------------------------

► Arquivos Utilizados no Vídeo:

► Avaliando um Modelo de Classificação - Aprendizado de Máquinas em Python

► A Árvore de Decisão - Algoritmos de Aprendizado de Máquinas

► O KNN (K-Nearest Neighbors) - Algoritmos de Aprendizado de Máquinas

► A Regressão Logística - Algoritmos de Aprendizado de Máquinas

-----------------------------------------------------------------------

Fala Impressionadores! Hoje vamos dar início a mais um projeto real para portfólio de Ciência de Dados!

O projeto de hoje é a Análise do Titanic que também é um dataset do Kaggle para competição!

Para essa análise nós vamos dividir as aulas, e nessa primeira aula vamos fazer uma análise mais simples desses dados e submeter ao Kaggle para avaliar os nossos resultados.

Vamos utilizar a árvore de classificação, KNN e a Regressão Logísitca para essas análises iniciais.

Para a próxima aula a ideia é definir uma acurácia de 85%, então vamos melhorar esse projeto completo de ciência de dados para te mostrar o que pode ser feito para melhorar esses resultados!

-----------------------------------------------------------------------

Hashtag Programação

► Ative as notificações (clica no sininho)!
► Curta o nosso vídeo!

-----------------------------------------------------------------------

Redes Sociais

Aqui nos vídeos do canal da Hashtag Programação ensinamos diversas dicas de Python para que você consiga se desenvolver nessa linguagem de programação!

-----------------------------------------------------------------------

Conteúdo da Aula

00:00 Introdução e Informações Importantes
01:52 Informações da base de dados
02:16 Avaliação do modelo
03:32 Importação e visualização dos dados
04:49 Ydata-profiling (análise de dados rápida)
06:45 Análise da base de dados
07:42 Visualização da base de teste
09:18 Tratamento inicial dos dados
17:44 Considerando colunas que não são de texto
19:22 Seleção de modelos para classificação dos dados
23:48 Árvore de Classificação
25:00 KNN – K Neighbors Classifier
25:47 Regressão Logística
26:27 Avaliação dos modelos (acurácia e matriz de confusão)
28:33 Fazendo a previsão para os dados de teste
30:39 Enviando o arquivo da competição para teste
31:33 Conclusão

#cienciadedados #hashtagprogramacao
Рекомендации по теме
Комментарии
Автор

Fala galera!
Gostou do vídeo? Deixa a sua curtida e se inscreve no canal!




HashtagProgramacao
Автор

Que top. Eatou estudando esse caso exatamente agora.

FabioRBelotto
Автор

Teremos a continuação do video do perceptron?

nelsondesantijunior
Автор

em 16:56 voce nao deveria preencher os valore nan da coluna Fare dos dados de TESTE pela moda da coluna Fare dos dados de TREINO? pq imagina que vc tenha nos dados de teste 5 linhas e fare esta vazio nas 5, nao haveria moda para preencher... estou equivocado?

willianc.l
Автор

mas nao ficou claro, o que eu quero com esse modelo? que pergunta eu respondo?

luismicioneiro