
Avis du pôle scientifique de Kinesport
Pastille verte
Pastille verte
Cette étude longitudinale rétrospective est un article à faible risque de biais, tous les critères méthodologiques majeurs sont respectés permettant de limiter et contrôler au mieux les biais dans l’étude.
De tels modèles sont considérés comme des modèles linéaires à variation temporelle en fonction de la structure de leurs composants et peuvent donc nécessiter un certain nombre d'observations (c'est-à-dire de performances) pour estimer correctement les relations entre la charge d'entraînement et les performances. Pour surmonter certaines de ces limites, des améliorations de l'ancien modèle de réponse impulsionnelle ont été proposés en utilisant un algorithme récursif afin d'estimer les paramètres en fonction de chaque entrée du modèle (c'est-à-dire la charge d'entraînement) et en introduisant des variations de la réponse à la fatigue sur un seul cycle d’entraînement. D'autres adaptations du modèle Fitness-Fatigue ont également été développées dans le but d'améliorer à la fois la qualité de l'ajustement et la précision des prédictions. Néanmoins, les modèles de réponse impulsionnelle ont cherché à atténuer les processus physiologiques sous-jacents impliqués par l'exercice en un petit nombre d'entités pour prédire les effets de l'entraînement tant en endurance (course à pied, vélo, ski et natation) qu’en activités plus complexes (lancer du marteau, gymnastique et judo). Cette approche simpliste pourrait empêcher de saisir la relation appropriée entre l'entraînement et la performance, et finalement nuire à la précision des prédictions. De plus, à l'exception de celui de Matabuena et al., ces modèles supposent que l'effet d'entraînement est maximal à la fin de la séance d'entraînement. Cette hypothèse n'est raisonnable que pour la composante négative du modèle (c'est-à-dire « Fatigue »), où sa valeur maximale est prise immédiatement après la séance. En ce qui concerne les effets positifs induits par l'entraînement (c’est-à-dire « Fitness »), une telle réponse est assez discutable puisque les adaptations physiologiques se poursuivent dès la fin de la séance d'exercice. Par exemple, les adaptations des muscles squelettiques à l'entraînement décrites par l'augmentation de la masse musculaire, la vitesse de raccourcissement des fibres et les modifications de l'activité de la myosine ATPase sont connues pour être progressives plutôt qu'instantanées. Par conséquent, des fonctions sérielles et bi-exponentielles ont été proposées pour contrecarrer ces limitations et mieux décrire les adaptations d'entraînement par des fonctions de croissance et de décroissance exponentielles, en fonction des réponses physiologiques chez le rat.
Une approche plus statistique a été utilisée pour étudier les effets de la charge d'entraînement sur la performance en utilisant une analyse en composantes principales et des modèles mixtes linéaires sur différentes périodes. Ces modèles déduisent des paramètres à partir de toutes les données disponibles (c'est-à-dire en combinant des sujets au lieu d'un modèle par sujet) mais permettent aux paramètres de varier en fonction de l'hétérogénéité entre les athlètes. Le modèle étant multivarié, le caractère multidimensionnel de la performance pourrait être conservé en incluant des informations psychologiques, nutritionnelles et techniques comme prédicteurs. Cependant, les auteurs n'ont pas pris en compte la facette cumulative des charges d'entraînement quotidiennes, où les fonctions cumulatives exponentielles et décroissantes telles que proposées par Candau et al. peuvent convenir à la modélisation des performances.
Des alternatives issues du domaine des sciences informatiques ont également été utilisées pour clarifier la relation charge d'entraînement - performance dans un but prédictif. Plus particulièrement, les approches d'apprentissage automatique sont généralement axées sur la généralisation des modèles (c'est-à-dire la précision avec laquelle un modèle est capable de prédire les valeurs des résultats pour des données inédites). Diverses approches tendent à maximiser un tel critère. Par exemple, on peut effectuer des procédures de validation croisée (cross-validation - CV), dans lesquelles les données sont séparées en ensembles d'apprentissage pour l'estimation des paramètres et en ensembles de tests pour la prédiction. Une telle procédure favorise la détermination de modèles optimaux, par rapport à la famille de modèles considérés et quant à leur capacité de généralisation. Dans le même temps, les procédures de CV permettent de diagnostiquer le sous-ajustement et le sur-ajustement du modèle. Le sous-ajustement décrit généralement un modèle inflexible incapable de capturer des régularités notables dans un ensemble d'observations typiques. En revanche, le surajustement représente un modèle surentraîné, qui a tendance à mémoriser chaque observation particulière, entraînant ainsi des taux d'erreur élevés lors de la prédiction sur des données inconnues. Alors que les études susmentionnées visaient à décrire les relations entre la charge d'entraînement et les performances en estimant les paramètres du modèle et en testant le modèle sur un seul ensemble de données, la généralisation des modèles ne peut être garantie. Cela remet en cause leur utilité dans une application prédictive. D'autre part, les méthodologies de modélisation utilisant des procédures de CV sont la norme dans un but prédictif plutôt que d'être uniquement descriptives. À la connaissance des auteurs, seules quelques études récentes ont modélisé les performances avec des modèles Fitness-Fatigue utilisant une procédure de CV, et l’une d’entre elles a séparé les données en deux ensembles égaux de données d'entraînements et de tests respectivement. Ludwig et al. ont rapporté que l'optimisation de tous les paramètres, y compris le terme de décalage, rend le modèle sujet au surajustement. Par conséquent, les interprétations tirées des prévisions ainsi que des paramètres du modèle peuvent être incorrectes.
Les adaptations physiologiques impliquées par l'exercice étant complexes, certains auteurs ont étudié la relation entre l'entraînement et la performance en utilisant des réseaux neuronaux artificiels (Artificial Neural Networks - ANN), des modèles non linéaires d'apprentissage automatique. Malgré les faibles erreurs de prédiction rapportées (par exemple, une erreur de 0,05 seconde sur une performance de 200m en natation), les considérations méthodologiques de leur étude (principalement influencées par une petite taille d'échantillon) et la nature « boite noire / black-box » des ANN, remettent en question leur utilisation dans la modélisation des performances sportives. Les sciences informatiques offrent de nombreux modèles d'apprentissage automatique, bien qu'elles soient souvent réduites dans les ANN à la prédiction des performances sportives. Si l’on considère les performances sportives, des algorithmes puissants issus de l'apprentissage supervisé pourraient également être envisagés pour résoudre les problèmes de modélisation des performances sportives, soit par une régression, soit par une formulation de classification du problème. Pour n'en citer que quelques-unes, les approches non linéaires telles que les modèles Random Forest (RF) tiennent compte des relations non linéaires entre une cible et un large ensemble de prédicteurs pour faire des prédictions. D'une manière différente, les modèles linéaires tels que les régressions linéaires régularisées ont également prouvé leur efficacité dans des contextes de haute dimensionnalité et de multicolinéarité. Sur cette base, les deux pourraient être utiles à des fins de modélisation des performances sportives.
À ce jour, aucune famille de modèles (c'est-à-dire les modèles de réponse impulsionnelle, basés sur la physiologie, statistiques et d'apprentissage automatique) ne semble être privilégiée pour la prédiction de la performance sportive à partir d’un ensemble de données, principalement en raison d'un manque de preuves et de confiance dans la modélisation des effets de l’entraînement et la précision des prédictions de performance. De plus, comme la c
Une approche plus statistique a été utilisée pour étudier les effets de la charge d'entraînement sur la performance en utilisant une analyse en composantes principales et des modèles mixtes linéaires sur différentes périodes. Ces modèles déduisent des paramètres à partir de toutes les données disponibles (c'est-à-dire en combinant des sujets au lieu d'un modèle par sujet) mais permettent aux paramètres de varier en fonction de l'hétérogénéité entre les athlètes. Le modèle étant multivarié, le caractère multidimensionnel de la performance pourrait être conservé en incluant des informations psychologiques, nutritionnelles et techniques comme prédicteurs. Cependant, les auteurs n'ont pas pris en compte la facette cumulative des charges d'entraînement quotidiennes, où les fonctions cumulatives exponentielles et décroissantes telles que proposées par Candau et al. peuvent convenir à la modélisation des performances.
Des alternatives issues du domaine des sciences informatiques ont également été utilisées pour clarifier la relation charge d'entraînement - performance dans un but prédictif. Plus particulièrement, les approches d'apprentissage automatique sont généralement axées sur la généralisation des modèles (c'est-à-dire la précision avec laquelle un modèle est capable de prédire les valeurs des résultats pour des données inédites). Diverses approches tendent à maximiser un tel critère. Par exemple, on peut effectuer des procédures de validation croisée (cross-validation - CV), dans lesquelles les données sont séparées en ensembles d'apprentissage pour l'estimation des paramètres et en ensembles de tests pour la prédiction. Une telle procédure favorise la détermination de modèles optimaux, par rapport à la famille de modèles considérés et quant à leur capacité de généralisation. Dans le même temps, les procédures de CV permettent de diagnostiquer le sous-ajustement et le sur-ajustement du modèle. Le sous-ajustement décrit généralement un modèle inflexible incapable de capturer des régularités notables dans un ensemble d'observations typiques. En revanche, le surajustement représente un modèle surentraîné, qui a tendance à mémoriser chaque observation particulière, entraînant ainsi des taux d'erreur élevés lors de la prédiction sur des données inconnues. Alors que les études susmentionnées visaient à décrire les relations entre la charge d'entraînement et les performances en estimant les paramètres du modèle et en testant le modèle sur un seul ensemble de données, la généralisation des modèles ne peut être garantie. Cela remet en cause leur utilité dans une application prédictive. D'autre part, les méthodologies de modélisation utilisant des procédures de CV sont la norme dans un but prédictif plutôt que d'être uniquement descriptives. À la connaissance des auteurs, seules quelques études récentes ont modélisé les performances avec des modèles Fitness-Fatigue utilisant une procédure de CV, et l’une d’entre elles a séparé les données en deux ensembles égaux de données d'entraînements et de tests respectivement. Ludwig et al. ont rapporté que l'optimisation de tous les paramètres, y compris le terme de décalage, rend le modèle sujet au surajustement. Par conséquent, les interprétations tirées des prévisions ainsi que des paramètres du modèle peuvent être incorrectes.
Les adaptations physiologiques impliquées par l'exercice étant complexes, certains auteurs ont étudié la relation entre l'entraînement et la performance en utilisant des réseaux neuronaux artificiels (Artificial Neural Networks - ANN), des modèles non linéaires d'apprentissage automatique. Malgré les faibles erreurs de prédiction rapportées (par exemple, une erreur de 0,05 seconde sur une performance de 200m en natation), les considérations méthodologiques de leur étude (principalement influencées par une petite taille d'échantillon) et la nature « boite noire / black-box » des ANN, remettent en question leur utilisation dans la modélisation des performances sportives. Les sciences informatiques offrent de nombreux modèles d'apprentissage automatique, bien qu'elles soient souvent réduites dans les ANN à la prédiction des performances sportives. Si l’on considère les performances sportives, des algorithmes puissants issus de l'apprentissage supervisé pourraient également être envisagés pour résoudre les problèmes de modélisation des performances sportives, soit par une régression, soit par une formulation de classification du problème. Pour n'en citer que quelques-unes, les approches non linéaires telles que les modèles Random Forest (RF) tiennent compte des relations non linéaires entre une cible et un large ensemble de prédicteurs pour faire des prédictions. D'une manière différente, les modèles linéaires tels que les régressions linéaires régularisées ont également prouvé leur efficacité dans des contextes de haute dimensionnalité et de multicolinéarité. Sur cette base, les deux pourraient être utiles à des fins de modélisation des performances sportives.
À ce jour, aucune famille de modèles (c'est-à-dire les modèles de réponse impulsionnelle, basés sur la physiologie, statistiques et d'apprentissage automatique) ne semble être privilégiée pour la prédiction de la performance sportive à partir d’un ensemble de données, principalement en raison d'un manque de preuves et de confiance dans la modélisation des effets de l’entraînement et la précision des prédictions de performance. De plus, comme la c