filmov
tv
Pipeline avec ColumnTransformer (scikit-learn / Python)

Показать описание
Implémentation de l'AFDM (analyse factorielle des données mixtes) à l'aide d'un "Pipeline" scikit-learn. Utilisation de l'outil "ColumnTransformer" pour effectuer les transformations de variables conditionnellement à leurs types (quantitatives [StandardScaler] et qualitatives [OneHotEncoder, Réduction par la racine de la fréquence]), les données étant ensuite présentées à un algorithme d'ACP (analyse en composantes principales). Elaboration d'une classe héritière de StandardScaler pour implémenter la réduction des indicatrices par la racine de la fréquence. Sauvegarde du "modèle" dans un fichier binaire à l'aide du package "dill". Chargement et application du modèle sur un individu supplémentaire. Comparaison de nos résultats avec ceux du package "scientisttools" qui fait référence en analyse de données sous Python.
00:00 Pipeline et l'outil ColumnTransformer
02:40 AFDM - Analyse factorielle des données mixtes
04:20 Architecture du pipeline pour obtenir l'AFDM via une ACP
07:15 Les données "Joueurs de tennis"
08:53 Démarrage du notebook et importation des données
09:45 Classe héritière de StandardScaler pour la réduction des indicatrices
14:00 1er pipeline pour le recodage des variables qualitatives
15:48 ColumnTransfomer : préparation différenciée selon le type des variables
17:12 2nd pipeline englobant la préparation et l'ACP
19:55 Projection des individus dans l'espace factoriel
21:07 Plan factoriel - Comparaison avec "scientisttools"
22:22 Appliquer le pipeline à un individu supplémentaire
25:18 Sauvegarde du pipeline (package "dill")
27:08 Chargement du pipeline pour le déploiement
29:44 Déploiement sur un individu supplémentaire
00:00 Pipeline et l'outil ColumnTransformer
02:40 AFDM - Analyse factorielle des données mixtes
04:20 Architecture du pipeline pour obtenir l'AFDM via une ACP
07:15 Les données "Joueurs de tennis"
08:53 Démarrage du notebook et importation des données
09:45 Classe héritière de StandardScaler pour la réduction des indicatrices
14:00 1er pipeline pour le recodage des variables qualitatives
15:48 ColumnTransfomer : préparation différenciée selon le type des variables
17:12 2nd pipeline englobant la préparation et l'ACP
19:55 Projection des individus dans l'espace factoriel
21:07 Plan factoriel - Comparaison avec "scientisttools"
22:22 Appliquer le pipeline à un individu supplémentaire
25:18 Sauvegarde du pipeline (package "dill")
27:08 Chargement du pipeline pour le déploiement
29:44 Déploiement sur un individu supplémentaire