Nouvelles Du Monde

Les scientifiques utilisent l’apprentissage automatique pour dévoiler de nouveaux prédicteurs du cancer du sein post-ménopausique

Les scientifiques utilisent l’apprentissage automatique pour dévoiler de nouveaux prédicteurs du cancer du sein post-ménopausique

L’un des types de cancer les plus courants chez les femmes dans le monde est le cancer du sein. Plusieurs facteurs prédictifs de cette maladie ont été identifiés, notamment des facteurs génétiques héréditaires, des facteurs de reproduction et le mode de vie.

Des études antérieures ont souligné la différence étiologique entre les cancers du sein pré- et post-ménopausiques. Récemment, les scientifiques ont combiné diverses approches pour prédire avec précision le cancer du sein chez les femmes.

Étude: Combinaison de l’apprentissage automatique avec des modèles de Cox pour identifier les prédicteurs d’un cancer du sein post-ménopausique incident dans la biobanque britannique. Crédit d’image : aslysun / Shutterstock.com

Arrière-plan

Les méthodes d’apprentissage automatique (ML) peuvent analyser de grands ensembles de données sur des prédicteurs et traiter des relations non linéaires complexes. Bien que des études antérieures aient utilisé le ML pour la prédiction du risque de cancer du sein, elles n’ont pas été utilisées pour identifier les prédicteurs.

La United Kingdom Biobank (UKB), qui comprend une cohorte étendue et détaillée, offre la possibilité d’adopter des approches sans hypothèses pour identifier de nouveaux prédicteurs du cancer du sein. Un développement récent des scores de risque polygénique (PRS) peut projeter l’effet de centaines et de milliers de variantes génétiques associées à des maladies ou des traits spécifiques à l’aide d’études d’association à l’échelle du génome (GWAS).

Le PRS peut être utilisé pour identifier les personnes présentant un risque élevé de maladie et les cibler pour une prescription précoce de statines. Notamment, PRS a ajouté de la précision aux prédicteurs de risque de maladie coronarienne existants, tels que le score de risque de Framingham.

Lire aussi  Acide folique à haute dose pendant la grossesse lié au risque de cancer chez les enfants

Auparavant, la PRS du cancer du sein était associée à des modèles de prédiction du risque, tels que le modèle Tyrer-Cuzick et l’algorithme BOADICEA (Breast and Ovarian Analysis of Disease Incidence and Carrier Estimation Algorithm). Bien que l’interaction entre le PRS et les caractéristiques phénotypiques comme les interactions gène-environnement ait été analysée pour le cancer du sein, des résultats contradictoires ont été rapportés.

À propos de l’étude

Une récente Rapports scientifiques L’étude a utilisé des méthodes d’apprentissage automatique (ML) pour la sélection des fonctionnalités, suivies de modèles de Cox pour la prédiction des risques. L’objectif principal de cette étude était de démontrer l’application efficace des méthodes ML pour la sélection des caractéristiques afin d’aider les méthodes statistiques classiques.

Les diagrammes de dépendance des caractéristiques SHapley Additive exPlanation (SHAP) ont été utilisés pour explorer l’interaction potentielle entre les caractéristiques phénotypiques et PRS. Les données de l’UKB ont été utilisées pour l’étude actuelle, qui contient plus d’un demi-million de participants d’Angleterre, du Pays de Galles et d’Écosse. Les données de base ont été recueillies au moyen d’entretiens verbaux avec une infirmière qualifiée, de questionnaires, d’échantillons biologiques et d’un examen physique.

Les femmes post-ménopausées âgées de 40 à 69 ans au départ ont été recrutées en raison de l’hétérogénéité étiologique susmentionnée selon le statut ménopausique. L’incidence du cancer du sein a été identifiée à l’aide des codes de la Classification internationale des maladies, dans laquelle PRS313 et PRS120k étaient considérés comme des caractéristiques génétiques potentielles.

Lire aussi  Le marché mondial de la thérapie par cellules souches allogéniques devrait croître à un TCAC de 9,85% d'ici 2030

Résultats de l’étude

Au total, 104 313 participantes ont été incluses dans cette étude, dont 4 010 ont développé un cancer du sein au cours de la période de suivi de 11,9 ans. En combinant le ML avec les approches statistiques traditionnelles de l’épidémiologie du cancer, plusieurs facteurs de risque connus et inconnus pour l’incidence du cancer post-ménopausique ont été identifiés.

Les facteurs de risque connus identifiés comprenaient l’âge à la ménopause, la testostérone et l’âge. Cinq nouveaux prédicteurs, dont la biochimie sanguine, la numération globulaire et les biomarqueurs urinaires, ont également été identifiés.

Les prédicteurs nouvellement identifiés étaient fortement associés à l’incidence du cancer du sein post-ménopausique. À l’avenir, d’autres recherches seront nécessaires pour comprendre s’il s’agit de facteurs de risque potentiellement modifiables du cancer du sein.

Le modèle XGBoost a sélectionné une mesure détaillée de la composition corporelle plutôt que l’indice de masse corporelle (IMC), ce qui implique que la mesure précise de la composition corporelle est un prédicteur important du cancer du sein. Le taux métabolique de base s’est également avéré être un prédicteur significatif du cancer du sein, ce qui contredit une étude précédente qui n’a trouvé aucune association entre le taux métabolique de base et le cancer du sein.

L’urée plasmatique, qui est un biomarqueur sanguin lié à la fonction rénale, était également associée au cancer du sein. C’est la première fois qu’une association entre le phosphate plasmatique, le sodium ou la créatinine dans l’urine avec le cancer du sein est rapportée.

Lire aussi  Les scientifiques de Wuhan ont été les premiers à contracter le COVID-19 : rapport

Les deux scores de risque polygénique ont été classés comme les facteurs de risque les plus forts par les modèles ML agnostiques. Les régressions de Cox ont prouvé que les PRS sont des prédicteurs significatifs du cancer du sein post-ménopausique.

conclusion

La présente étude a identifié cinq nouvelles corrélations statistiquement significatives avec le cancer du sein post-ménopausique, y compris les biomarqueurs urinaires, la numération globulaire et la biochimie sanguine. Lors de l’ajout de ces cinq nouvelles caractéristiques au modèle de base de Cox, la performance de discrimination a été maintenue. De plus, les deux PRS pré-spécifiés se sont avérés être les caractéristiques les plus importantes par la valeur SHAP.

Ces résultats motivent d’autres recherches sur l’utilisation de mesures anthropométriques plus précises pour améliorer la prédiction du cancer du sein. La validation externe des résultats est la prochaine étape importante avant la mise en œuvre dans la pratique clinique.

Référence de la revue :

  • Liu, X., Morelli, D., Littlejohns, TJ, et al. (2023) Combinaison de l’apprentissage automatique avec des modèles de Cox pour identifier les prédicteurs du cancer du sein post-ménopausique incident dans la biobanque britannique. Rapports scientifiques 13. doi:10.1038/s41598-023-36214-0

2023-06-12 04:57:00
1686536107


#Les #scientifiques #utilisent #lapprentissage #automatique #pour #dévoiler #nouveaux #prédicteurs #cancer #sein #postménopausique

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT