3 FUNÇÕES para MELHORAR a performance dos modelos de Machine Learning

preview_player
Показать описание
Nesse vídeo de hoje eu quero mostrar pra vocês 3 funções para melhorar a performance dos modelos de Machine Learning que vai te proporcionar criar e treinar
milhares de modelos de Machine Learning simultaneamente fazendo ajustes de hiperparametros dos algoritmos.

Eu quero te mostrar na pratica e fazer com você passo a passo te explicando em detalhes a diferença das funções GridSearchCV, RandomSearchCV e BayesianSearch. Essas funções
são otimizadores de hiperparametros dos algoritmos de Machine Learning.

Vamos fazer alguns exemplos na pratica utilizando os algoritmos de classificação do Random Forest e do SVM (Support Vector Machine) e com esses dois
algoritmos iremos criar e treinar diversos modelos preditivos para podermos avaliar a diferença entre as 3 funções para melhorar a performance dos
modelos de Machine Learning.

Vídeos que podem te ajudar bastante:

Como fazer NORMALIZAÇÃO e PADRONIZAÇÃO de DADOS (O Guia Completo)

COMO MELHORAR OS MODELOS DE MACHINE LEARNING EM PYTHON

MACHINE LEARNING: COMO PREVER LIBERAÇÃO DE EMPRÉSTIMO

Os links abaixo são de afiliados, comprando através desses links eu ganho uma pequena comissão do site. É uma forma de você me ajudar a continuar produzindo esses excelentes conteúdos.

📚 Livros que me ajudam a aprimorar meus conhecimentos

👍 Equipamentos que utilizo no meu dia a dia

Link para download do material apresentado no vídeo (Jupyter Notebook e Arquivo de Dados)

#cienciadedados
#python
#machinelearning
Рекомендации по теме
Комментарии
Автор

Agradeço por este vídeo como reposta de uma sugestão que eu deixei no canal e me ajudou muito, parabéns pelos vídeos, espero que o canal venha crescer cada vez mais.

Tenho uma dúvida sobre como fazer split (separação), tenho os dados de treino, validação e de teste:
- nos dados de validação eu posso fazer a padronização dos dados e testar a performance do modelo e depois do modelo escolhido usar os dados de teste?
- em que momento eu devo fazer a split (separação) quando eu tenho somente dados para treino e teste?
- eu posso usar os valores da variável resposta para fazer novas variáveis?
- scaler só podemos fazer depois da separação?
- podemos normalizar variáveis antes ou depois da separação dos dados?
- o que é vazamento de informações do treino para validação ou teste e vice-versa?

Talvez essas dúvidas possam ser uma sugestão para um novo vídeo.

RafaelRibeiro-ugjw