Bien que certaines études universitaires en sciences et médecine du sport emploient des statisticiens, de telles collaborations sont une exception plutôt que la norme. Pour déterminer l'étendue de la collaboration, les auteurs ont effectué un examen systématique des articles publiés dans les revues de sciences du sport du premier quartile en 2019. L'extraction initiale a porté sur 8970 articles ; sur les 400 articles sélectionnés au hasard, 299 ont été jugés éligibles et inclus dans la revue (figure 1). Ils ont constaté que seulement 13,3 % (IC 95 % : 9,5 % à 17,2 %) des articles avaient au moins un coauteur affilié à un département de biostatistique, de statistique, de science des données, d'analyse des données, d'épidémiologie, de mathématiques, d'informatique ou d'économie (figure 2). Il convient de noter qu'ils ont inclus un large éventail de départements méthodologiques, car ils reconnaissent que les personnes issues de ces domaines peuvent posséder une expertise statistique considérable. Lorsqu'il est utilisé ici le terme « statisticien », sont inclues largement des personnes issues d'autres disciplines axées sur les méthodes si elles ont une formation et une expérience statistiques étendues.
La pénurie de statisticiens travaillant dans ce domaine signifie que les chercheurs en sciences du sport et en médecine du sport conçoivent souvent des études et effectuent des analyses par eux-mêmes. Certains de ces chercheurs ne suivent pas une formation approfondie en statistique et sont bien équipés pour s'acquitter de ces tâches. Cependant, comme pour d'autres disciplines appliquées, les chercheurs en sciences et médecine du sport manquent souvent de formation adéquate en matière de conception d'études et de statistiques, ce qui peut entraîner des erreurs.
Les auteurs sont également préoccupés par un phénomène qui touche les sciences et la médecine du sport. Les scientifiques dans ces domaines développent des méthodes statistiques et les introduisent dans la littérature sans que la communauté des statistiques ne les soumette à un examen adéquat par les pairs. Beaucoup de ces méthodes sont statistiquement et mathématiquement défectueuses. Bien que les progrès en statistiques proviennent parfois de disciplines appliquées (par exemple, les travaux sur les mesures effectuées dans l'éducation et la psychologie), ces nouvelles méthodes statistiques ont été présentées, critiquées et évaluées dans la littérature statistique avant d'être introduites et utilisées dans un contexte appliqué.
Dans ce commentaire, traduit par Xavier Laurent, les auteurs présentent deux séries d'études de cas qui illustrent l'importance d'une collaboration efficace entre les chercheurs en sciences et médecine du sport et les statisticiens. Ils examinent les obstacles qui ont empêché la collaboration et recommandent les prochaines étapes à suivre.
Des erreurs statistiques peuvent se produire lors de la conception de l'étude, de l'analyse des données ou de la rédaction du rapport. Les études de cas décrites ci-dessous ne fournissent pas une liste exhaustive des erreurs possibles. Il est mis plutôt en évidence plusieurs cas où
une erreur aurait pu être évitée grâce à une meilleure connaissance statistique ou à une meilleure collaboration avec les statisticiens. D'autres références fournissent d'autres exemples d'erreurs statistiques courantes dans les sciences et la médecine du sport.
Erreurs dans la conception des études - physiologie de l'exercice
Une étude portant sur 14 hommes actifs visait à établir la fiabilité d'un test de biomarqueurs utilisé pour mesurer l'intégrité gastro-intestinale (GI) dans des conditions de stress thermique. Les participants ont effectué deux tests intermittents de stress thermique à l'effort, et l'intégrité GI a été mesurée à l'aide de plusieurs tests de biomarqueurs, dont la protéine intestinale de liaison aux acides gras (I- FABP). Les auteurs ont indiqué que le test I- FABP au repos « présentait une fiabilité absolue, relative et acceptable, de modérée à forte, entre les répétitions ». Toutefois, cette conclusion était basée sur la découverte d'une corrélation significative entre les mesures répétées, avec un coefficient de corrélation de Pearson de 0,75 (p<0,01).
Ce cas illustre deux problèmes :
1. Un coefficient de corrélation intraclasse (ICC) est une mesure de fiabilité plus appropriée
2. Lorsque nous avons extrait les données de la figure 3 de ce document pour estimer approximativement l'ICC, nous avons trouvé une valeur et un IC à 95% de 0,72 (0,32 à 0,89).
Cette estimation est trop imprécise pour tirer des conclusions utiles ; la fiabilité peut être plausible et aller d'insuffisante à excellente. Dans ce cas, les auteurs n'ont pas réussi à effectuer un calcul a priori de la taille de l'échantillon, ce qui a conduit à une étude trop petite pour répondre de manière adéquate à la question qui nous intéresse.
Erreurs dans l'analyse des données - nutrition et endocrinologie dans l'exercice
Une étude sur les niveaux de vitamine D et le statut menstruel de 77 femmes en âge de fréquenter l'université a conclu que « les femmes qui n'atteignaient pas le niveau recommandé de 30 ng/mL de 25(OH)D avaient presque cinq fois plus de chances d'avoir des troubles du cycle menstruel que les femmes qui se trouvaient au-dessus du niveau de vitamine D recommandé ».
Un examen plus approfondi de l'analyse a révélé des problèmes. Alors qu'une proportion plus élevée du groupe à faible teneur en vitamine D (40 % des 60) présentait des troubles menstruels par rapport au groupe à forte teneur en vitamine D (12 % des 17), l'analyse n'a pas tenu compte des différences importantes entre les groupes. Le groupe à faible teneur en vitamine D était 17% plus lourd que le groupe à forte teneur en vitamine D - la masse corporelle moyenne étant de 66,7 contre 57,0 kg. La masse corporelle était également fortement liée aux troubles menstruels : les femmes souffrant de troubles menstruels avaient une masse corporelle moyenne de 77,6 kg contre 57,9 kg pour les femmes sans troubles menstruels. Ainsi, la relation apparente entre une faible teneur en vitamine D et les troubles menstruels peut être entièrement due à une forte confusion avec la masse corporelle. Les auteurs auraient dû entreprendre une analyse multivariable qui tienne compte de la masse corporelle.
Erreurs dans les rapports statistiques - médecine du sport/orthopédie/rééducation
Une vaste étude a été entreprise pour sous-estimer les facteurs qui prédisent la récupération des athlètes deux ans après une reconstruction du LCA : « des analyses de régression multivariables ont été réalisées pour examiner quels facteurs de risque de base étaient indépendamment associés à chaque variable de résultat... les variables de résultat primaires ont toutes été traitées comme étant continues », mais le manuscrit fait état d’ORs. Les ORs sont généralement indiqués pour des résultats binaires et non continus. Cette divergence a attiré l'attention d'un auteur dans le présent commentaire, et une série de lettres au rédacteur en chef a permis de déterminer qu'une analyse très nuancée, réfléchie et appropriée avait été effectuée sur les données. Cependant, l'approche de modélisation a été mal décrite, ce qui rend difficile de juger de la validité de l'étude et entrave également la reproductibilité. Dans ce cas, l'équipe de recherche comprenait des personnes ayant une expertise statistique qui ont participé à la planification de l'étude et à l'analyse des données ; cependant, ces personnes n'ont peut-être pas été suffisamment impliquées dans la rédaction du document.
L'introduction de nouvelles méthodes statistiques dans la littérature implique généralement plusieurs étapes :
1. Rédaction des équations mathématiques qui formulent explicitement la méthode
2. Établissement du comportement empirique de la méthode au moyen d'épreuves mathématiques, de simulations ou des deux
3. Publication dans une revue statistique ou dans une revue d'intérêt général après examen par les pairs statisticiens.
Compte tenu de l'expertise technique requise, les statisticiens ou les mathématiciens font partie intégrante du processus. Un exemple classique est la technique statistique de l'analyse de la signification des micro-réseaux (ou SAM), qui a été introduite en 2001. La SAM est née d'une collaboration entre le statisticien Robert Tibshirani et les biologistes Virginia Goss Tusher et Gilbert Chu, qui tentaient de développer de meilleures méthodes d'analyse des données des microréseaux. Le premier article sur la SAM a été publié dans PNAS (Proceedings of the National Academy of Sciences of the United States of America) ; il contient des équations mathématiques et des preuves ; et compare formellement les performances de la SAM à d'autres méthodes qui étaient populaires pour l'analyse des données des micro-réseaux à l'époque. C'est un exemple ; les revues statistiques publient chaque année de nombreux articles présentant de nouvelles approches statistiques. Ici, nous mettons en évidence trois cas où des méthodes statistiques ont été introduites dans la littérature sans contrôle statistique approprié.
Méthodes d'identification des répondants et des non-répondants
Les chercheurs en sciences du sport et en médecine du sport s'intéressent à l'identification des « répondants » et des "non-répondants" dans le cadre des interventions. Alors que l'hétérogénéité des réponses a été largement couverte dans la littérature sur les statistiques appliquées, ces lignes directrices ont été largement négligées dans les sciences et la médecine du sport. Les auteurs dans ces domaines ont utilisé diverses techniques analytiques pour identifier les réponses différentielles, notamment l'analyse des clusters de moyennes k suivie d'une analyse de la variance (ANOVA), le regroupement des réponses en fonction de l'erreur-type de mesure et, plus récemment, un nouvel algorithme analytique a été proposé. Toutefois, aucune de ces approches n'a de fondement statistique ou philosophique et, de fait, elles présentent des propriétés statistiques médiocres, telles que des taux d'erreur de type I élevés.
Modifications de l'analyse en composantes principales
Dans un autre exemple, des modifications à l'application de l'analyse en composantes principales (ACP) appliquée dans le cadre de l'analyse fonctionnelle des données ont été proposées dans le contexte de l'exploration des données de la science du sport cinématique à haute dimension. L'ACP estime les composantes principales d'un ensemble de courbes dont les valeurs mesurées sont stockées dans une matrice de données de telle sorte que chaque ligne contient les données d'une courbe individuelle. Dans une récente pré-print sur SportRxiv, l'auteur affirme qu'il est plus approprié d'estimer les principales composantes de la matrice de données, de telle sorte que chaque colonne contienne les valeurs mesurées d'une courbe individuelle. Cependant, cette approche alternative viole l'hypothèse d'indépendance de l'ACP, ne centre pas les données de manière conventionnelle, interprète les scores résultants comme des charges et a été critiquée par un expert en la matière. Cela est nécessaire pour éviter toute confusion dans l'application de l'APC par les scientifiques dans les domaines appliqués.
Inférence basée sur la magnitude
Le cas de l'inférence basée sur la magnitude (MBI) est une mise en garde sur ce qui peut arriver lorsqu'une nouvelle approche statistique est largement adoptée avant d'être examinée. La MBI est apparue dans la littérature des sciences du sport en 2006 d'une manière très inhabituelle pour une méthode statistique. Le document d'introduction ne contenait aucune formule mathématique et aucune preuve ou simulation mathématique démontrant le comportement empirique de la méthode. L'article a été publié en tant que commentaire dans la littérature des sciences du sport, et non dans une revue méthodologique, et il n'a pas fait l'objet d'un examen par les statisticiens. La méthode a été critiquée par la communauté des statistiques (et les auteurs de ce document) pendant plus d'une décennie. En plus de manquer d'une base mathématique solide, la méthode conduit à des taux d'erreur de type I élevés qui ne sont pas transparents et conduit fréquemment les chercheurs à tirer des conclusions trop optimistes. Ces critiques des MBI ont même attiré une attention négative pour les sciences du sport dans les médias populaires.
Dans tous ces cas, une collaboration efficace avec les statisticiens aurait pu avoir lieu :
1. Indiquer aux chercheurs les méthodes existantes qui permettent d'atteindre les mêmes objectifs analytiques
2. Aider les chercheurs à formaliser mathématiquement les nouvelles méthodes et à évaluer leurs propriétés statistiques. En effet, les percées théoriques sont souvent inspirées par des besoins pratiques.
Les nombreux obstacles à la collaboration entre les statisticiens et les scientifiques du sport sont comparables à ceux qui entravent la collaboration entre les statisticiens et de nombreuses autres disciplines appliquées. Les universités et les instituts de recherche sont souvent organisés dans l'espace par discipline, ce qui offre
peu de possibilités d'interaction entre les scientifiques du sport et les statisticiens. De nombreuses disciplines scientifiques emploient des spécialistes méthodologiques intermédiaires pour aider à combler ce fossé - par exemple, la psychologie a des psychologues mathématiques et la chimie a des chimistes instrumentistes. Malheureusement, les spécialistes en méthodologie sont moins nombreux dans les sciences du sport. L'analyse sportive est une sous-discipline des sciences du sport qui connaît une croissance rapide, mais la plupart des analystes sportifs sont actuellement employés par des équipes sportives professionnelles et se concentrent uniquement sur la mesure des performances ;
les scientifiques du sport ayant une formation statistique de haut niveau font défaut dans le milieu universitaire.
Les chercheurs en sciences et en médecine du sport apportent leur expertise dans toute une série de disciplines, dont la physiologie, la biomécanique, la nutrition et la psychologie. Toutefois, certains de ces chercheurs ne reçoivent qu'une formation limitée en matière de conception d'études et de statistiques. Comme de nombreux chercheurs en recherche appliquée, ils peuvent essayer d'apprendre les statistiques appliquées par l'étude personnelle ou par des études statistiques.
Le problème peut être aggravé lorsque des techniques statistiques médiocres sont transmises des mentors aux étudiants, propageant ainsi de mauvaises pratiques à la prochaine génération de chercheurs. Enfin, un manque d'expertise statistique dans le processus d'examen par les pairs des revues signifie que de nombreux articles sont publiés en utilisant des méthodes statistiques sous-optimales ; cela crée souvent une boucle de rétroaction positive car les méthodes sont copiées d'un article à l'autre. Le BJSM (British Journal of Sports Medicine) n'a commencé à avoir des rédacteurs adjoints en statistiques qu'en 2019.
Bien que de nombreux chercheurs en sciences du sport et en médecine du sport souhaiteraient bénéficier d'un soutien statistique pour leurs projets, ce soutien n'est souvent pas disponible. Les statisticiens mathématiques bénéficient d'une plus grande reconnaissance académique pour leurs travaux théoriques que pour leurs travaux appliqués, et peuvent donc ne pas être intéressés par une collaboration avec des chercheurs appliqués. Les statisticiens appliqués peuvent être intéressés par une collaboration mais ont souvent besoin d'un soutien financier important pour leur temps, ce qui peut les mettre hors de portée des budgets de nombreux projets en sciences et médecine du sport. En outre, des difficultés de communication peuvent surgir car les statisticiens ne sont généralement pas des experts du domaine des sciences ou de la médecine du sport. Cette barrière « linguistique » peut conduire à une mauvaise compréhension du problème de recherche spécifique au domaine, des données ou des analyses ultérieures.
Les différences de culture peuvent constituer un obstacle à la collaboration. Ce qui est considéré comme un véritable savoir et ce qui est autorisé en matière de revendications scientifiques diffère selon les disciplines scientifiques. Les statisticiens ont tendance à être prudents lorsqu'ils interprètent les données, une prudence qui est souvent justifiée lorsqu'ils évaluent les allégations de connaissances sur la biologie ou la pharmacothérapie d'une maladie grave, mais qui peut être trop stricte lorsqu'elle est appliquée au type de questions pratiques courantes dans les sciences du sport, comme celle de savoir lequel des deux régimes d'entraînement est le plus susceptible d'entraîner une amélioration des performances. Par conséquent, le scientifique du sport peut ne pas être d'accord avec l'interprétation fournie par le statisticien, et donc reconsidérer la possibilité d'obtenir une assistance statistique pour de futurs projets. Les statisticiens peuvent également être réticents à travailler avec des scientifiques du sport si leurs conseils sont régulièrement ignorés.