Accueil>Tests>Questions>L'analyse en composantes principales vise à réduire le nombre de dimensions (ou de caractéristiques) dans un ensemble de données donné. L'objectif est de réduire ce nombre à une taille gérable, mais aussi de préserver l'intégrité de la structure du jeu de données, les tendances, les catégories (et ainsi de suite) sont conservées.
Question du test Machine learning - Les bases
L'analyse en composantes principales vise à réduire le nombre de dimensions (ou de caractéristiques) dans un ensemble de données donné. L'objectif est de réduire ce nombre à une taille gérable, mais aussi de préserver l'intégrité de la structure du jeu de données, les tendances, les catégories (et ainsi de suite) sont conservées.
Facile
La méthode “______” consiste en la réduction du nombre de dimensions d’un jeu de données. Le but est de réduire leur nombre à un niveau “gérable” ou “interprétable” tout en préservant l’intégrité du jeu de données : tendances, structures, catégories… Quel est le mot manquant?
Auteur: MartinStatut : PubliéeQuestion passée 118 fois
Modifier
0
Évaluations de la communautéPersonne n'a encore évalué cette question, soyez le premier !
20
Comment gérer les données manquantes dans un jeu de données d'apprentissage donné ?12
Comment gérer les données manquantes dans un jeu de données d'apprentissage donné ?7
Qu'est-ce que l'apprentissage par ensemble ? Il consiste à …11
Le jeu de validation est utilisé pour fournir des évaluations fréquentes et non biaisées de l'ajustement du modèle sur le jeu d'entraînement tout en ajustant ses hyperparamètres/paramètres: en d'autres termes, le modèle est trouvé et ensuite testé sur le jeu de validation avant d'être amélioré une fois de plus.7
Quel est le mot manquant dans la phrase suivante : Overfitting est la production d'un modèle qui correspond trop étroitement à l'ensemble de données d'apprentissage et peut donc ne pas s'adapter à d'autres ensembles de données et donc ne pas effectuer de prévision fiable.8
Quelles sont les différences/similarités entre une fonction de perte, une fonction d'erreur et une fonction de coût?7
Clustering est un processus d'apprentissage automatique non supervisé qui vise à découvrir automatiquement des regroupements naturels dans les données d'entrée. Lorsque cette méthode est utilisée, le développeur peut choisir le nombre de groupes qu'il souhaite créer.