Nouvelles Du Monde

La capacité de l’IA à détecter le COVID-19 à partir de la toux est confrontée à des défis concrets

La capacité de l’IA à détecter le COVID-19 à partir de la toux est confrontée à des défis concrets

2024-02-09 05:44:48

Une récente Intelligence des machines naturelles L’étude a vérifié l’efficacité des classificateurs audio de l’intelligence artificielle (IA) pour prédire le statut d’infection par le coronavirus-2 du syndrome respiratoire aigu sévère (SRAS-CoV-2). Le SRAS-CoV-2 est l’organisme causal de la pandémie de maladie à coronavirus 2019 (COVID-19).

Étude: Les classificateurs audio basés sur l’IA ne montrent aucune preuve d’amélioration du dépistage du COVID-19 par rapport aux simples vérificateurs de symptômes. Crédit d’image : Poste d’Aliaksandra/Shutterstock

Arrière-plan

Puisque l’infection par le SRAS-CoV-2 pourrait provoquer des manifestations symptomatiques et asymptomatiques, il est important de développer des tests précis pour éviter la quarantaine de la population générale. Des études antérieures ont révélé que des classificateurs basés sur l’IA et formés avec des données audio respiratoires pourraient identifier le statut du SRAS-CoV-2.

Bien que ces études aient indiqué l’efficacité des classificateurs basés sur l’IA, de nombreux défis sont apparus lors de leur application dans des contextes réels. Certains facteurs qui ont retenu les applications de classificateur basées sur l’IA étaient les biais d’échantillonnage, les données non validées sur le statut COVID-19 des participants et le délai entre l’infection et l’enregistrement audio. Il est impératif de déterminer si les biomarqueurs audio du COVID-19 sont uniques à l’infection par le SRAS-CoV-2 ou s’ils constituent des signaux confondants inappropriés.

À propos de l’étude

L’étude actuelle s’est concentrée sur la détermination si les classificateurs audio peuvent être utilisés avec précision pour le dépistage du COVID-19. Un ensemble de données de réaction en chaîne par polymérase (PCR) à grande échelle lié au dépistage audio du COVID-19 (ABCS) a été utilisé. Pour cette étude, les participants du programme d’évaluation en temps réel de la transmission communautaire (REACT) et du service Test-and-Trace (T+T) du National Health Service (NHS) ont été invités. Toutes les données démographiques pertinentes ont été extraites des enregistrements T+T/REACT.

Lire aussi  Grand Theft Auto 6 offrira-t-il une toute nouvelle expérience ? Rockstar est sur le point de révolutionner

Les participants ont été invités à répondre aux questions du sondage et à enregistrer quatre clips audio. Pour les enregistrements audio, il leur était demandé de lire une phrase spécifique, suivie de trois expirations successives, produisant un son « ha ». De plus, il a été demandé aux participants d’enregistrer les toux forcées une à trois fois de suite. Tous les enregistrements ont été documentés au format .wav. La qualité des enregistrements audio a été évaluée et 5 157 enregistrements ont été supprimés pour des problèmes liés à la qualité.

Les figures humaines représentent les participants à l’étude et leur statut d’infection au COVID-19 correspondant, les différentes couleurs représentant différentes caractéristiques démographiques ou symptomatiques. Lorsque les participants sont répartis au hasard en ensembles de formation et de tests, les modèles de répartition aléatoire fonctionnent bien lors de la détection du COVID-19, atteignant des AUC supérieures à 0,8 ; cependant, les performances de l’ensemble de tests appariés semblent chuter jusqu’à une AUC estimée entre 0,60 et 0,65, une AUC de 0,5 représentant une classification aléatoire. Les performances de classification gonflées sont également observées dans les ensembles de tests conçus hors distribution, tels que : l’ensemble de tests conçu, dans lequel un ensemble sélectionné de groupes démographiques apparaît uniquement dans l’ensemble de tests, et l’ensemble de tests longitudinaux, dans lequel il n’y a pas de chevauchement dans l’ensemble de tests. heure de soumission entre les instances de train et de test. Les intervalles de confiance à 95 % calculés via la méthode d’approximation normale sont présentés, ainsi que les n numéros correspondants du train et des ensembles de test.

Résultats de l’étude

Dans cette étude, un ensemble de données acoustiques respiratoires de 67 842 individus a été collecté. Parmi eux, 23 514 personnes ont été testées positives au COVID-19. Toutes les données ont été liées aux résultats des tests PCR. Il convient de noter que le nombre le plus important de participants négatifs au COVID-19 ont été recrutés à partir de six cycles REACT par rapport au canal T+T.

Lire aussi  La pandémie aide à restaurer la nature à Hawaï et change le tourisme

L’ensemble de données considéré dans cette étude présentait une couverture prometteuse dans toute l’Angleterre. Aucune association significative entre la situation géographique et le statut COVID-19 n’a été notée. Le niveau le plus élevé de déséquilibre lié au COVID-19 a été constaté à Cornwall. Une étude précédente a indiqué un biais de recrutement dans ABCS, particulièrement lié à l’âge, à la langue et au sexe, à la fois dans les données de formation et dans les ensembles de tests. Malgré ce biais, l’ensemble de données de formation a été équilibré en fonction de l’âge et du sexe des sous-groupes positifs et négatifs pour le COVID.

Conformément aux études précédentes, l’analyse non ajustée menée dans cette étude a montré que les classificateurs d’IA peuvent prédire le statut du COVID-19 avec une grande précision. Cependant, lorsque les facteurs de confusion mesurés ont été appariés, une faible performance des classificateurs d’IA dans la détection du statut SARS-CoV-2 a été observée.

Sur la base des résultats, la présente étude a proposé quelques lignes directrices pour rectifier l’effet du biais de recrutement pour les études futures. Certaines des recommandations sont énumérées ci-dessous :

  • Les échantillons audio stockés dans les référentiels doivent inclure des détails sur les critères de recrutement de l’étude. En outre, les informations pertinentes sur les individus, notamment leur sexe, leur âge, l’heure du test COVID-19, les symptômes du SRAS-CoV-2 et leur emplacement, doivent être documentées avec l’enregistrement audio.
  • Tous les facteurs de confusion doivent être identifiés et comparés pour aider à contrôler les biais de recrutement.
  • La conception expérimentale doit être développée en gardant à l’esprit les biais possibles. Dans la plupart des cas, l’appariement des données entraîne une réduction de la taille de l’échantillon. Les études observationnelles recrutent des participants en se concentrant sur la possibilité maximisée de faire correspondre les facteurs de confusion mesurés.
  • Les valeurs prédictives des classificateurs doivent être comparées aux résultats du protocole standard.
  • La précision prédictive des classificateurs d’IA doit être évaluée. Cependant, l’exactitude prédictive, la sensibilité et la spécificité varient en fonction de la population ciblée.
  • L’utilité des classificateurs doit être évaluée pour chaque résultat de test.
  • L’étude de réplication doit être menée dans des cohortes randomisées. En outre, des études pilotes doivent être menées dans des contextes réels sur la base d’une utilité spécifique au domaine.
  • Lire aussi  Un expert répond à l'opportunité ChatGPT d'aider à rechercher des extraterrestres sur Mars

    Conclusions

    L’étude actuelle présente des limites, notamment la possibilité de facteurs de confusion potentiels non mesurés dans les canaux de recrutement REACT et T+T. Par exemple, le test PCR pour le COVID-19 a été effectué plusieurs jours après l’auto-dépistage des symptômes. En revanche, les tests PCR dans REACT ont été réalisés à une date prédéterminée, quelle que soit l’apparition des symptômes. Bien que la majorité des facteurs de confusion aient été appariés, il existe une possibilité de présence d’une variation prédictive résiduelle.

    Malgré les limites, cette étude a souligné la nécessité de développer des procédures précises d’évaluation de l’apprentissage automatique pour obtenir des résultats impartiaux. En outre, l’étude a révélé que les facteurs de confusion sont difficiles à détecter et à contrôler dans de nombreuses applications d’IA.

    Référence du journal :

    • Coppock, H. et coll. (2024) Les classificateurs d’IA basés sur l’audio ne montrent aucune preuve d’amélioration du dépistage du COVID-19 par rapport aux simples vérificateurs de symptômes. Intelligence des machines naturelles. 1-14. DOI : 10.1038/s42256-023-00773-8,



    #capacité #lIA #détecter #COVID19 #partir #toux #est #confrontée #des #défis #concrets
    1707447874

    Facebook
    Twitter
    LinkedIn
    Pinterest

    Leave a Comment

    This site uses Akismet to reduce spam. Learn how your comment data is processed.

    ADVERTISEMENT