Appel à une collaboration statistique accrue dans le domaine des sciences du sport, de la médecine du sport et de l'exercice physique et de la physiothérapie sportive

Kinesport
Les erreurs statistiques sont courantes dans de nombreux domaines biomédicaux. Sainani et al. dans leur publication de 2020, pensent  que la nature et l'impact de ces erreurs sont suffisamment importants dans les sciences et la médecine du sport pour justifier une attention particulière. De mauvaises pratiques méthodologiques et statistiques ont conduit à des appels au changement dans d'autres domaines, tels que la psychologie. ils pensent qu'un appel à l'action similaire est nécessaire dans le domaine de la science et de la médecine du sport. Plus précisément, ils  voient deux besoins pressants :

1. Accroître la collaboration entre les chercheurs et les statisticiens.
2. Renforcer la formation statistique dans la discipline des sciences de l'exercice, de la médecine et de la physiothérapie (PT).

Bien que certaines études universitaires en sciences et médecine du sport emploient des statisticiens, de telles collaborations sont une exception plutôt que la norme. Pour déterminer l'étendue de la collaboration, les auteurs ont effectué un examen systématique des articles publiés dans les revues de sciences du sport du premier quartile en 2019. L'extraction initiale a porté sur 8970 articles ; sur les 400 articles sélectionnés au hasard, 299 ont été jugés éligibles et inclus dans la revue (figure 1). Ils ont constaté que seulement 13,3 % (IC 95 % : 9,5 % à 17,2 %) des articles avaient au moins un coauteur affilié à un département de biostatistique, de statistique, de science des données, d'analyse des données, d'épidémiologie, de mathématiques, d'informatique ou d'économie (figure 2). Il convient de noter qu'ils ont inclus un large éventail de départements méthodologiques, car ils reconnaissent que les personnes issues de ces domaines peuvent posséder une expertise statistique considérable. Lorsqu'il est utilisé ici le terme « statisticien », sont inclues largement des personnes issues d'autres disciplines axées sur les méthodes si elles ont une formation et une expérience statistiques étendues.
La pénurie de statisticiens travaillant dans ce domaine signifie que les chercheurs en sciences du sport et en médecine du sport conçoivent souvent des études et effectuent des analyses par eux-mêmes. Certains de ces chercheurs ne suivent pas une formation approfondie en statistique et sont bien équipés pour s'acquitter de ces tâches. Cependant, comme pour d'autres disciplines appliquées, les chercheurs en sciences et médecine du sport manquent souvent de formation adéquate en matière de conception d'études et de statistiques, ce qui peut entraîner des erreurs. 

Les auteurs sont également préoccupés par un phénomène qui touche les sciences et la médecine du sport. Les scientifiques dans ces domaines développent des méthodes statistiques et les introduisent dans la littérature sans que la communauté des statistiques ne les soumette à un examen adéquat par les pairs. Beaucoup de ces méthodes sont statistiquement et mathématiquement défectueuses. Bien que les progrès en statistiques proviennent parfois de disciplines appliquées (par exemple, les travaux sur les mesures effectuées dans l'éducation et la psychologie), ces nouvelles méthodes statistiques ont été présentées, critiquées et évaluées dans la littérature statistique avant d'être introduites et utilisées dans un contexte appliqué.
Dans ce commentaire, traduit par Xavier Laurent, les auteurs présentent deux séries d'études de cas qui illustrent l'importance d'une collaboration efficace entre les chercheurs en sciences et médecine du sport et les statisticiens. Ils examinent les obstacles qui ont empêché la collaboration et  recommandent les prochaines étapes à suivre.

ÉTUDES DE CAS : ERREURS STATISTIQUES ÉVITABLES 

Des erreurs statistiques peuvent se produire lors de la conception de l'étude, de l'analyse des données ou de la rédaction du rapport. Les études de cas décrites ci-dessous ne fournissent pas une liste exhaustive des erreurs possibles. Il est mis plutôt en évidence plusieurs cas où une erreur aurait pu être évitée grâce à une meilleure connaissance statistique ou à une meilleure collaboration avec les statisticiens. D'autres références fournissent d'autres exemples d'erreurs statistiques courantes dans les sciences et la médecine du sport.

Erreurs dans la conception des études - physiologie de l'exercice

Une étude portant sur 14 hommes actifs visait à établir la fiabilité d'un test de biomarqueurs utilisé pour mesurer l'intégrité gastro-intestinale (GI) dans des conditions de stress thermique. Les participants ont effectué deux tests intermittents de stress thermique à l'effort, et l'intégrité GI a été mesurée à l'aide de plusieurs tests de biomarqueurs, dont la protéine intestinale de liaison aux acides gras (I- FABP). Les auteurs ont indiqué que le test I- FABP au repos « présentait une fiabilité absolue, relative et acceptable, de modérée à forte, entre les répétitions ». Toutefois, cette conclusion était basée sur la découverte d'une corrélation significative entre les mesures répétées, avec un coefficient de corrélation de Pearson de 0,75 (p<0,01).

Ce cas illustre deux problèmes :

1. Un coefficient de corrélation intraclasse (ICC) est une mesure de fiabilité plus appropriée
2. Lorsque nous avons extrait les données de la figure 3 de ce document pour estimer approximativement l'ICC, nous avons trouvé une valeur et un IC à 95% de 0,72 (0,32 à 0,89).

Cette estimation est trop imprécise pour tirer des conclusions utiles ; la fiabilité peut être plausible et aller d'insuffisante à excellente. Dans ce cas, les auteurs n'ont pas réussi à effectuer un calcul a priori de la taille de l'échantillon, ce qui a conduit à une étude trop petite pour répondre de manière adéquate à la question qui nous intéresse.

Erreurs dans l'analyse des données - nutrition et endocrinologie dans l'exercice

Une étude sur les niveaux de vitamine D et le statut menstruel de 77 femmes en âge de fréquenter l'université a conclu que « les femmes qui n'atteignaient pas le niveau recommandé de 30 ng/mL de 25(OH)D avaient presque cinq fois plus de chances d'avoir des troubles du cycle menstruel que les femmes qui se trouvaient au-dessus du niveau de vitamine D recommandé ».
Un examen plus approfondi de l'analyse a révélé des problèmes. Alors qu'une proportion plus élevée du groupe à faible teneur en vitamine D (40 % des 60) présentait des troubles menstruels par rapport au groupe à forte teneur en vitamine D (12 % des 17), l'analyse n'a pas tenu compte des différences importantes entre les groupes. Le groupe à faible teneur en vitamine D était 17% plus lourd que le groupe à forte teneur en vitamine D - la masse corporelle moyenne étant de 66,7 contre 57,0 kg. La masse corporelle était également fortement liée aux troubles menstruels : les femmes souffrant de troubles menstruels avaient une masse corporelle moyenne de 77,6 kg contre 57,9 kg pour les femmes sans troubles menstruels. Ainsi, la relation apparente entre une faible teneur en vitamine D et les troubles menstruels peut être entièrement due à une forte confusion avec la masse corporelle. Les auteurs auraient dû entreprendre une analyse multivariable qui tienne compte de la masse corporelle.

Erreurs dans les rapports statistiques - médecine du sport/orthopédie/rééducation

Une vaste étude a été entreprise pour sous-estimer les facteurs qui prédisent la récupération des athlètes deux ans après une reconstruction du LCA : « des analyses de régression multivariables ont été réalisées pour examiner quels facteurs de risque de base étaient indépendamment associés à chaque variable de résultat... les variables de résultat primaires ont toutes été traitées comme étant continues », mais le manuscrit fait état d’ORs. Les ORs sont généralement indiqués pour des résultats binaires et non continus. Cette divergence a attiré l'attention d'un auteur dans le présent commentaire, et une série de lettres au rédacteur en chef a permis de déterminer qu'une analyse très nuancée, réfléchie et appropriée avait été effectuée sur les données. Cependant, l'approche de modélisation a été mal décrite, ce qui rend difficile de juger de la validité de l'étude et entrave également la reproductibilité. Dans ce cas, l'équipe de recherche comprenait des personnes ayant une expertise statistique qui ont participé à la planification de l'étude et à l'analyse des données ; cependant, ces personnes n'ont peut-être pas été suffisamment impliquées dans la rédaction du document.

ÉTUDES DE CAS : INVENTER DE NOUVELLES STATISTIQUES

L'introduction de nouvelles méthodes statistiques dans la littérature implique généralement plusieurs étapes :

1. Rédaction des équations mathématiques qui formulent explicitement la méthode
2. Établissement du comportement empirique de la méthode au moyen d'épreuves mathématiques, de simulations ou des deux
3. Publication dans une revue statistique ou dans une revue d'intérêt général après examen par les pairs statisticiens.

Compte tenu de l'expertise technique requise, les statisticiens ou les mathématiciens font partie intégrante du processus. Un exemple classique est la technique statistique de l'analyse de la signification des micro-réseaux (ou SAM), qui a été introduite en 2001. La SAM est née d'une collaboration entre le statisticien Robert Tibshirani et les biologistes Virginia Goss Tusher et Gilbert Chu, qui tentaient de développer de meilleures méthodes d'analyse des données des microréseaux. Le premier article sur la SAM a été publié dans PNAS (Proceedings of the National Academy of Sciences of the United States of America) ; il contient des équations mathématiques et des preuves ; et compare formellement les performances de la SAM à d'autres méthodes qui étaient populaires pour l'analyse des données des micro-réseaux à l'époque. C'est un exemple ; les revues statistiques publient chaque année de nombreux articles présentant de nouvelles approches statistiques. Ici, nous mettons en évidence trois cas où des méthodes statistiques ont été introduites dans la littérature sans contrôle statistique approprié.

Méthodes d'identification des répondants et des non-répondants

Les chercheurs en sciences du sport et en médecine du sport s'intéressent à l'identification des « répondants » et des "non-répondants" dans le cadre des interventions. Alors que l'hétérogénéité des réponses a été largement couverte dans la littérature sur les statistiques appliquées, ces lignes directrices ont été largement négligées dans les sciences et la médecine du sport. Les auteurs dans ces domaines ont utilisé diverses techniques analytiques pour identifier les réponses différentielles, notamment l'analyse des clusters de moyennes k suivie d'une analyse de la variance (ANOVA), le regroupement des réponses en fonction de l'erreur-type de mesure et, plus récemment, un nouvel algorithme analytique a été proposé. Toutefois, aucune de ces approches n'a de fondement statistique ou philosophique et, de fait, elles présentent des propriétés statistiques médiocres, telles que des taux d'erreur de type I élevés.

Modifications de l'analyse en composantes principales

Dans un autre exemple, des modifications à l'application de l'analyse en composantes principales (ACP) appliquée dans le cadre de l'analyse fonctionnelle des données ont été proposées dans le contexte de l'exploration des données de la science du sport cinématique à haute dimension. L'ACP estime les composantes principales d'un ensemble de courbes dont les valeurs mesurées sont stockées dans une matrice de données de telle sorte que chaque ligne contient les données d'une courbe individuelle. Dans une récente pré-print sur SportRxiv, l'auteur affirme qu'il est plus approprié d'estimer les principales composantes de la matrice de données, de telle sorte que chaque colonne contienne les valeurs mesurées d'une courbe individuelle. Cependant, cette approche alternative viole l'hypothèse d'indépendance de l'ACP, ne centre pas les données de manière conventionnelle, interprète les scores résultants comme des charges et a été critiquée par un expert en la matière. Cela est nécessaire pour éviter toute confusion dans l'application de l'APC par les scientifiques dans les domaines appliqués.

Inférence basée sur la magnitude

Le cas de l'inférence basée sur la magnitude (MBI) est une mise en garde sur ce qui peut arriver lorsqu'une nouvelle approche statistique est largement adoptée avant d'être examinée. La MBI est apparue dans la littérature des sciences du sport en 2006 d'une manière très inhabituelle pour une méthode statistique. Le document d'introduction ne contenait aucune formule mathématique et aucune preuve ou simulation mathématique démontrant le comportement empirique de la méthode. L'article a été publié en tant que commentaire dans la littérature des sciences du sport, et non dans une revue méthodologique, et il n'a pas fait l'objet d'un examen par les statisticiens. La méthode a été critiquée par la communauté des statistiques (et les auteurs de ce document) pendant plus d'une décennie. En plus de manquer d'une base mathématique solide, la méthode conduit à des taux d'erreur de type I élevés qui ne sont pas transparents et conduit fréquemment les chercheurs à tirer des conclusions trop optimistes. Ces critiques des MBI ont même attiré une attention négative pour les sciences du sport dans les médias populaires.

Dans tous ces cas, une collaboration efficace avec les statisticiens aurait pu avoir lieu :

1. Indiquer aux chercheurs les méthodes existantes qui permettent d'atteindre les mêmes objectifs analytiques
2. Aider les chercheurs à formaliser mathématiquement les nouvelles méthodes et à évaluer leurs propriétés statistiques. En effet, les percées théoriques sont souvent inspirées par des besoins pratiques.

OBSTACLES À LA COLLABORATION 

Les nombreux obstacles à la collaboration entre les statisticiens et les scientifiques du sport sont comparables à ceux qui entravent la collaboration entre les statisticiens et de nombreuses autres disciplines appliquées. Les universités et les instituts de recherche sont souvent organisés dans l'espace par discipline, ce qui offre peu de possibilités d'interaction entre les scientifiques du sport et les statisticiens. De nombreuses disciplines scientifiques emploient des spécialistes méthodologiques intermédiaires pour aider à combler ce fossé - par exemple, la psychologie a des psychologues mathématiques et la chimie a des chimistes instrumentistes. Malheureusement, les spécialistes en méthodologie sont moins nombreux dans les sciences du sport. L'analyse sportive est une sous-discipline des sciences du sport qui connaît une croissance rapide, mais la plupart des analystes sportifs sont actuellement employés par des équipes sportives professionnelles et se concentrent uniquement sur la mesure des performances ; les scientifiques du sport ayant une formation statistique de haut niveau font défaut dans le milieu universitaire.
Les chercheurs en sciences et en médecine du sport apportent leur expertise dans toute une série de disciplines, dont la physiologie, la biomécanique, la nutrition et la psychologie. Toutefois, certains de ces chercheurs ne reçoivent qu'une formation limitée en matière de conception d'études et de statistiques. Comme de nombreux chercheurs en recherche appliquée, ils peuvent essayer d'apprendre les statistiques appliquées par l'étude personnelle ou par des études statistiques.
Le problème peut être aggravé lorsque des techniques statistiques médiocres sont transmises des mentors aux étudiants, propageant ainsi de mauvaises pratiques à la prochaine génération de chercheurs. Enfin, un manque d'expertise statistique dans le processus d'examen par les pairs des revues signifie que de nombreux articles sont publiés en utilisant des méthodes statistiques sous-optimales ; cela crée souvent une boucle de rétroaction positive car les méthodes sont copiées d'un article à l'autre. Le BJSM (British Journal of Sports Medicine) n'a commencé à avoir des rédacteurs adjoints en statistiques qu'en 2019.
Bien que de nombreux chercheurs en sciences du sport et en médecine du sport souhaiteraient bénéficier d'un soutien statistique pour leurs projets, ce soutien n'est souvent pas disponible. Les statisticiens mathématiques bénéficient d'une plus grande reconnaissance académique pour leurs travaux théoriques que pour leurs travaux appliqués, et peuvent donc ne pas être intéressés par une collaboration avec des chercheurs appliqués. Les statisticiens appliqués peuvent être intéressés par une collaboration mais ont souvent besoin d'un soutien financier important pour leur temps, ce qui peut les mettre hors de portée des budgets de nombreux projets en sciences et médecine du sport. En outre, des difficultés de communication peuvent surgir car les statisticiens ne sont généralement pas des experts du domaine des sciences ou de la médecine du sport. Cette barrière « linguistique » peut conduire à une mauvaise compréhension du problème de recherche spécifique au domaine, des données ou des analyses ultérieures.
Les différences de culture peuvent constituer un obstacle à la collaboration. Ce qui est considéré comme un véritable savoir et ce qui est autorisé en matière de revendications scientifiques diffère selon les disciplines scientifiques. Les statisticiens ont tendance à être prudents lorsqu'ils interprètent les données, une prudence qui est souvent justifiée lorsqu'ils évaluent les allégations de connaissances sur la biologie ou la pharmacothérapie d'une maladie grave, mais qui peut être trop stricte lorsqu'elle est appliquée au type de questions pratiques courantes dans les sciences du sport, comme celle de savoir lequel des deux régimes d'entraînement est le plus susceptible d'entraîner une amélioration des performances. Par conséquent, le scientifique du sport peut ne pas être d'accord avec l'interprétation fournie par le statisticien, et donc reconsidérer la possibilité d'obtenir une assistance statistique pour de futurs projets. Les statisticiens peuvent également être réticents à travailler avec des scientifiques du sport si leurs conseils sont régulièrement ignorés.

RECOMMANDATIONS 

1. Les auteurs encouragent la communauté des sciences du sport, de la médecine et de la physiothérapie à rechercher davantage d'interaction avec les statisticiens, notamment en les faisant participer à des conférences, à des exposés et à des événements organisés par les départements, ainsi qu'à l'enseignement dispensé par ces derniers. Cette interaction accrue aidera la communauté des sciences appliquées et la communauté clinique à prendre davantage conscience que la statistique est elle-même une science - les anciennes techniques étant écartées et les nouvelles adoptées à mesure que les données deviennent disponibles - plutôt qu'un ensemble de recettes. Les statisticiens engagés auront probablement une meilleure appréciation de la richesse des données intéressantes et des problèmes analytiques que la science et la médecine du sport ont à offrir.

2. La communauté des sciences appliquées et des cliniciens devrait avoir l'habitude d'associer officiellement les statisticiens aux projets de recherche dès la phase de planification. C'est l'une des sept habitudes des chercheurs très efficaces. Lorsque les statisticiens sont impliqués à un stade précoce, cela permet d'éviter des erreurs coûteuses dans la conception des études et de prendre en compte leur temps dans les budgets. Lorsque cela est financièrement possible, les auteurs  encouragent les programmes universitaires à engager des statisticiens appliqués à plein temps pour leurs départements. Cela permettra d'améliorer la qualité et la reproductibilité de la recherche et d'accroître l'efficacité des plans d'étude. Là où il est actuellement impossible d'engager un statisticien appliqué, une alternative consiste à engager un scientifique du sport ayant une formation approfondie et formelle en statistique (par exemple, un master) et des liens établis avec des statisticiens. Cette personne pourrait jouer le rôle de méthodologiste intermédiaire pour d'autres chercheurs, tout en améliorant l'enseignement des statistiques grâce à sa participation à l'enseignement. Il est important que les statisticiens et les scientifiques/cliniciens du sport reconnaissent que les collaborations efficaces prennent du temps et que le respect mutuel est nécessaire pour se développer.

3. Les départements des sciences du sport et de la médecine devraient améliorer l'enseignement des statistiques. Il pourrait s'agir d'élargir les programmes d'études statistiques, d'impliquer les statisticiens dans l'enseignement ou de tirer parti de la richesse des programmes de formation en ligne de haute qualité mais coûteux disponibles, tels que le programme de sciences des données de Johns Hopkins sur Coursera. Grâce à l'accès très facile à ces programmes de formation en ligne, il n'est plus nécessaire que chaque institution conçoive son propre programme d'études statistiques. Au contraire, les cours en ligne peuvent fournir une formation didactique, qui peut être associée à un instructeur local pour fournir un renforcement pratique du contenu. En particulier, les cours en ligne pourraient être complétés par des exercices d'analyse de données guidées impliquant la science du sport et des ensembles de données cliniques pertinentes. Les auteurs recommandent en outre que ces cours incluent un cours sur les questions conceptuelles plutôt que sur les preuves mathématiques et le calcul ; il est plus important pour un scientifique du sport de comprendre, par exemple, un IC à 95% que de le calculer.

4. Les auteurs réitérent les appels précédents à promouvoir une spécialisation de biostatisticien du sport au sein des sciences du sport et du sport, et de la médecine de l'exercice/physiothérapie du sport, à l'instar d'autres spécialisations quantitatives spécifiques à un domaine, telles que la psychométrie ou la géostatistique. Une concentration de biostatisticien du sport pourrait exister au sein d'un département plus large de santé/kinésiologie/science du sport et un étudiant suivrait la majeure partie de son cursus en statistiques (par exemple, 50 à 70 % des crédits) avec des travaux de cours optionnels en santé/science du sport/kinésiologie (par exemple, 15 à 25 %), et terminerait par une thèse qui pourrait être publiée dans une revue statistique ou méthodologique. Ces étudiants seraient formés non seulement à utiliser des méthodes avancées dans la recherche, mais aussi à travailler spécifiquement pour faire des progrès méthodologiques.

Bibliographie

Sainani, K. L., Borg, D. N., Caldwell, A. R., Butson, M. L., Tenan, M. S., Vickers, A. J., … Bargary, N. (2020). Call to increase statistical collaboration in sports science, sport and exercise medicine and sports physiotherapy. British Journal of Sports Medicine, (August), bjsports-2020-102607. https://doi.org/10.1136/bjsports-2020-102607