Nouvelles Du Monde

Une approche axée sur les données pour le défi cycliste “Everesting”

Une approche axée sur les données pour le défi cycliste “Everesting”

Le tableau 1 présente les statistiques descriptives du jeu de données Everesting, qui comprend 2561 enregistrements (voir section « Méthodes »). Nous soulignons que les paramètres spécifiques de l’Everesting sont liés les uns aux autres ; par exemple, la pente maximale de 17,20 % correspond à la distance la plus courte (environ 105,74 km) et inversement. De plus, comme prévu, la plupart des cyclistes tentent le défi de l’Everesting lorsque la température extérieure est douce 16,24 ± 5,76 °C. Les routes à fortes pentes (> 10%) ne sont pas disponibles partout et, par conséquent, les cyclistes peuvent être contraints de sélectionner une pente à pente modérée 7,57 ± 1,94% pour leur tentative. La plage du nombre de répétitions en pente est comprise entre 2 et 1001,00, même si la majorité des points de données se situe entre 63,24 ± 63,92.

La figure 1 montre le coefficient de corrélation linéaire normalisé entre chaque paramètre Everesting (attribut d’entrée) et le temps nécessaire pour terminer le défi Everesting (attribut cible), classé par ordre décroissant. La valeur absolue du coefficient de corrélation quantifie la contribution relative de chaque attribut d’entrée à l’attribut cible, et le signe indique une relation positive ou négative. L’effet de la température, de l’âge et du nombre de répétitions de collines sur le temps nécessaire pour terminer le défi Everesting est inférieur à celui de la distance, de la pente de la colline et de la puissance par unité de masse corporelle (voir la section “Méthodes” pour la puissance/unité). estimation de la masse). Évidemment, le coefficient de corrélation de ce dernier est − 1 puisque l’estimation de la puissance massique est proportionnelle à hjusqu’à/tjusqu’à. Étonnamment, le nombre de répétitions de côte, qui détermine les intervalles entre l’effort (montée) et la récupération (descente) n’est pas fortement corrélé avec le temps total pour terminer le défi Everesting. Cette observation contredit le nombre optimal de répétitions Hill (24) théoriquement dérivé par Swinnen et al.14. La diminution de la longueur de la montée permet des périodes de récupération plus fréquentes mais plus courtes pendant la descente, mais nécessite également des virages plus fréquents au bas et au sommet de la colline. La corrélation limitée avec le temps nécessaire pour relever le défi Everesting indique que le temps gagné en récupérant plus fréquemment lors de la tentative peut être perdu par le temps nécessaire pour tourner et accélérer en bas et en haut de la colline.

Figure 1

Coefficient de corrélation linéaire normalisé entre chaque paramètre Everesting (entrée) et le temps (attribut cible) pour terminer le défi Everesting, montrant que la puissance, la distance et le gradient sont les principaux facteurs qui déterminent le temps.

Le coefficient de corrélation montre que la puissance par unité de masse corporelle est l’attribut d’entrée le plus important, c’est-à-dire que l’augmentation de la puissance diminue le temps nécessaire pour relever le défi Everesting, ce qui est intuitif car l’augmentation de la puissance augmente la propulsion. Cet attribut d’entrée dépend de la condition physique et du talent du cycliste, ainsi que de sa masse corporelle. De plus, la distance totale et la pente de la colline sont les deux attributs d’entrée les plus importants suivants, et ils sont partiellement liés l’un à l’autre par le nombre de répétitions de colline. Le compromis entre la distance totale et la pente de la colline est au cœur du défi Everesting. Le temps nécessaire pour relever le défi Everesting augmente avec l’augmentation de la distance et diminue avec l’augmentation de la pente car un cycliste gagne plus d’altitude par unité de distance. Cependant, la vitesse moyenne diminue également avec l’augmentation du gradient et la puissance constante. Des rapports dans les médias suggèrent de manière anecdotique que les coureurs de niveau professionnel, qui sont talentueux, entraînés et peuvent produire une puissance élevée par unité de masse corporelle pendant longtemps, préfèrent que la pente soit aussi raide que possible pour minimiser le temps nécessaire pour terminer l’Everesting. défi7,8,16,17, ce qui est étayé par notre ensemble de données. Par exemple, les 10 meilleurs temps records du défi Everesting (le 24/08/22) ont tous été réalisés sur une colline avec une pente > 10 %, 8 sur 10 avec une pente > 13 % et 4 sur 10 avec une pente > 15 %, par rapport au gradient moyen de 7,57 % calculé sur la base de l’ensemble des données (voir tableau 1).

Lire aussi  la course. Verstappen devant Hamilton et Norris. Leclerc 4ème Diffusion en direct - Corriere.it

La figure 2 montre la relation par paires entre tous les attributs d’entrée et le temps (attribut cible) au format matriciel. La diagonale principale montre la fonction de densité de probabilité de chaque attribut. Notez que même si les résultats de la Fig. 2 montrent l’ensemble des données, les résultats sont similaires lors de la séparation des cyclistes masculins et féminins. Nous observons que le temps nécessaire pour relever le défi Everesting diminue avec l’augmentation de la pente et de la puissance, comme prévu sur la Fig. 1. Toutes les tentatives qui ont pris moins de 10 h se sont produites sur une colline avec une pente moyenne > 7 %. La figure 3 montre la puissance estimée par unité de masse corporelle par rapport au gradient, et la couleur de chaque point de données représente le temps nécessaire pour relever le défi Everesting (voir la barre de couleurs), illustrant ainsi que les cyclistes talentueux ou bien entraînés sélectionnent préférentiellement les collines avec des pentes raides.7,8,16,17 pour capitaliser sur leur talent et leur condition physique, contrairement aux cyclistes récréatifs qui ne peuvent pas supporter un effort physique aussi exigeant et, par conséquent, choisissent une pente moins raide. Par conséquent, la capacité d’un cycliste à gravir rapidement des collines escarpées (puissance élevée par unité de masse corporelle), plutôt que de simplement sélectionner une colline à forte pente, conduit probablement le temps nécessaire pour relever le défi Everesting. La sélection d’une pente inférieure à 7 % se traduit le plus souvent par des tentatives supérieures à 20 h, portées par l’augmentation de la distance du parcours (cf. Fig. 2). De plus, il n’existe aucune relation unique entre le gradient et la distance, et la variation des données pour un gradient constant ou une distance constante sur la figure 2 est due au nombre de répétitions de collines, qui peuvent différer pour chaque tentative individuelle en raison de la sélection de différentes collines. .

Figure 2
Figure 2

Relation par paires entre les attributs d’entrée et cibles sous forme de matrice avec la fonction de densité de probabilité de chaque attribut le long de la diagonale principale.

figure 3
figure 3

Puissance estimée par unité de masse corporelle en fonction de la pente, la couleur de chaque point de données indiquant le temps total (barre de couleur), illustrant que les cyclistes qui peuvent produire une puissance élevée par unité de masse sélectionnent préférentiellement une pente raide.

Nous effectuons une analyse par grappes en tenant compte de tous les attributs d’entrée et cibles pour segmenter l’ensemble de données en types de cyclistes distincts à l’aide d’algorithmes d’apprentissage automatique non supervisés. La figure 4 montre la puissance estimée par unité de masse corporelle en fonction de la distance, où nous indiquons la direction de l’augmentation/diminution du gradient et de la vitesse avec des flèches. Chaque point de données se regroupe dans l’un des trois types de cyclistes distincts : les groupes 1 (Chicago marron), 2 (Burnt orange) et 3 (Hokie stone), en utilisant un modèle de mélange gaussien (GMM, voir la section “Méthodes”), que nous déterminons pour fonctionnent mieux que k-moyens, k-médoïdes, densité (DBSCAN) et méthodes spectrales basées sur des métriques internes et externes. Nous montrons également les points de données colorés en fonction du temps (voir colorbar) pour aider à l’interprétation des différents groupes. La figure 4 montre que le groupe 1 (Chicago marron) représente probablement des cyclistes talentueux et très entraînés, caractérisés par une puissance élevée par unité de masse corporelle. Ces cyclistes ont la possibilité de sélectionner une pente raide car ils sont capables de maintenir une puissance de sortie élevée pendant une longue période, ce qui se traduit par un temps rapide pour relever le défi Everesting et concourir pour le record du monde. En revanche, le groupe 3 (pierre Hokie) représente probablement les cyclistes récréatifs qui choisissent généralement une colline avec une faible pente car ils ne peuvent pas maintenir une puissance de sortie élevée et, par conséquent, leur temps total pour terminer le défi dépasse 20 à 25 h. Entre les groupes 1 et 3, nous définissons le groupe 2 (Burnt orange) comme un groupe de cyclistes amateurs bien entraînés qui terminent le défi Everesting en 15–25 h, mais en général sélectionnent une colline avec une pente moins profonde (4– 10%) que les cyclistes élites du groupe 1.

Figure 4
chiffre 4

Puissance estimée par unité de masse corporelle par rapport à la distance, indiquant différents groupes de cyclistes (groupes 1, 2 et 3) et indiquant le temps nécessaire pour relever le défi Everesting.

La figure 5 montre la relation par paires entre la distance, le gradient, la puissance et le temps (attribut cible) sous forme de matrice, similaire à la figure 2 mais ne montrant que les trois attributs d’entrée qui affectent le plus l’attribut cible sur la base de la figure 1. Chacun des ces attributs suivent approximativement une distribution gaussienne (voir diagonale principale sur la figure 2) et, par conséquent, 68 % des points de données de chaque attribut sont confinés à un écart type de la moyenne arithmétique (voir tableau 1). La diagonale principale montre la fonction de densité de probabilité de chaque attribut, et nous colorons chaque point de données selon les trois types de cyclistes distincts de la Fig. 4 ; groupes 1 (Chicago marron), 2 (Burnt orange) et 3 (Hokie stone). À partir de la Fig. 5, nous observons la relation entre différents paramètres de l’Everesting, présentés en fonction des types de cyclistes distincts, confirmant ainsi davantage l’interprétation intuitive de ces différents types de cyclistes.

Figure 5
chiffre 5

Relation par paires entre les attributs d’entrée et cibles sous forme de matrice avec la fonction de densité de probabilité de chaque attribut le long de la diagonale principale et indiquant différents groupes de cyclistes (groupes 1, 2 et 3) sur la base d’un modèle de mélange gaussien.

Même si cela n’est pas explicitement montré sur les Fig. 4 et 5, nous déterminons que la séparation des cyclistes féminins et masculins donne des résultats et des interprétations similaires, mais il est important de souligner que l’ensemble de données pour les cyclistes féminins est d’un ordre de grandeur inférieur à celui des cyclistes masculins. Nous soulignons également les limites de l’estimation de la puissance par unité de masse corporelle dans ce travail, qui est uniquement basée sur l’énergie nécessaire pour surmonter le gain d’altitude réel dans le temps total nécessaire pour relever le défi Everesting, plutôt que sur une mesure à l’aide d’un wattmètre. . Par conséquent, il néglige les pertes d’énergie dues à la résistance au roulement, à la traînée aérodynamique et aux forces de frottement dans les roulements du vélo, qui sont faibles par rapport à la puissance nécessaire pour surmonter le gain d’élévation.25. Par conséquent, nous sous-estimons la puissance par unité de masse corporelle par rapport aux valeurs documentées dans les médias pour les tentatives de record du monde de l’Everesting, qui proviennent de mesures de wattmètre lors de tentatives de record du monde spécifiques. Par exemple, Sean Gardner a atteint une moyenne de 4,73 Watt/kg lors des ascensions lors de son record du monde de l’Everesting17alors que Keegan Swenson a produit en moyenne 3,59 Watt/kg pendant toute sa tentative26. À titre de comparaison, la puissance par unité de masse corporelle estimée pour Keegan Swenson dans cet article est de 3,14 Watt/kg, soit une différence d’environ 13 %. Notre estimation pourrait être améliorée en ne considérant que le temps ascendant, si ces données étaient disponibles, au lieu de considérer le temps total. La prise en compte des pertes d’énergie liées à la traînée aérodynamique, à la résistance au roulement et aux forces de frottement dans les roulements du vélo améliorerait également l’estimation de la puissance, mais nécessite également plus d’informations. La disponibilité des données du capteur de puissance, si elles sont correctement calibrées, en combinaison avec le poids du cycliste, fournirait les informations exactes.

Lire aussi  Alcaraz remporte la finale de Wimbledon contre Djokovic en cinq sets

Nous avons effectué une analyse par grappes avec différents algorithmes d’apprentissage automatique non supervisé pour segmenter les cyclistes en groupes homogènes, en fonction de leurs performances à l’Everesting. Chaque algorithme donne une solution et le nombre de clusters est spécifié a priori. Par conséquent, l’interprétation des résultats est importante pour sélectionner et interpréter une solution pertinente. Nous avons tenté k-signifie et k-medoids et sélectionné entre 2 et 5 clusters pour segmenter les données, et nous avons utilisé des métriques internes et externes pour évaluer la qualité des différents clusters, comme les shadow plots. Même si les diagrammes d’ombre montraient peu de chevauchement entre les grappes adjacentes, il n’était pas intuitif de reconnaître et d’associer différents types de cyclistes aux grappes résultantes. Nous avons également tenté d’utiliser des méthodes spectrales et des méthodes de densité (DBSCAN) avec un succès limité, probablement parce que les points de données sont densément emballés. Les modèles de mélange gaussien (GMM) ont mieux réussi à segmenter les données des cyclistes en groupes homogènes, car le regroupement était reproductible et piloté par les attributs d’entrée qui affichent le coefficient de corrélation le plus élevé avec l’attribut cible. En conséquence, l’algorithme segmente les données en clusters en fonction de niveaux de puissance distincts, ce qui est l’un des paramètres les plus importants pour distinguer les tentatives d’Everesting des cyclistes.

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT