Cette section présente les résultats des analyses utilisant la méthodologie proposée sur un ensemble de données réelles et ils sont comparés aux alternatives les plus courantes. Les performances de la méthode sont également étudiées au moyen d’une étude de simulation complète, avec et sans covariables.
Les performances et une application de la méthodologie proposée sont étudiées à travers une étude de simulation complète et un ensemble de données réelles sur l’incidence de Covid-19 en Espagne sur cette section.
Etude de simulation
Bien que la méthode d’estimation soit déjà connue et ait été testée auparavant, à notre connaissance, elle n’a jamais été utilisée dans le contexte des séries temporelles ARCH, et donc une étude de simulation approfondie a été menée pour s’assurer que le modèle se comporte comme prévu, y compris (ARCHgauche(1droite)), (ARgauche(1droite)), (MAgauche(1droite)) et (ARMAgauche(mathrm{1,1}droite)) structures pour le processus caché ({X}_{t}) défini comme
$$begin{array}{c}{X}_{t}={phi}_{0}+{phi}_{1}cdot {X}_{t-1}+{Z} _{t},{Z}_{t}^{2}={easy}_{0}+{easy}_{1}cdot {Z}_{t-1}^{2}+ {epsilon}_{t}text{(ARCH(1))}\{X}_{t}={phi}_{0}+alphacdot{X}_{t-1} +{epsilon}_{t}text{(AR(1))}\ {X}_{t}={phi}_{0}+theta cdot {epsilon}_{t- 1}+{epsilon}_{t}text{(MA(1))}\ {X}_{t}={phi }_{0}+alpha cdot {X}_{t -1}+theta cdot {epsilon}_{t-1}+{epsilon}_{t}text{(ARMA(1, 1))}end{tableau}$$
(4)
où ({epsilon }_{t}sim Nleft({mu }_{epsilon }left(tright),{sigma }_{epsilon }^{2}right) ).
Les valeurs des paramètres ({phi }_{1}), ({alpha}_{0}), ({alpha}_{1}), (alpha), (thêta), (q) et (oméga) variait de 0,1 à 0,9 pour chaque paramètre. Le biais absolu moyen, la longueur moyenne de l’intervalle (AIL) et la couverture moyenne de l’intervalle crédible à 95 % sont présentés dans le tableau 1. Pour résumer la robustesse du modèle, ces valeurs sont moyennées sur toutes les combinaisons de paramètres, étant donné que leur distribution antérieure est un delta de Dirac avec toute probabilité concentrée. dans la valeur de paramètre correspondante.
Pour chaque structure d’autocorrélation et combinaison de paramètres, un échantillon aléatoire de taille (n=1000) a été généré à l’aide de la fonction R arima.ouiet les paramètres (m=loggauche({M}^{*}droite)) et (bêta) ont été fixées à (0.2) et (0.4) respectivement. Plusieurs valeurs pour ces paramètres ont été prises en compte, mais aucune différence substantielle dans les performances du modèle n’a été observée en ce qui concerne la valeur de ces paramètres ou la taille de l’échantillon, en plus d’une couverture plus faible pour les tailles d’échantillon inférieures, comme on pouvait s’y attendre.
Incidence réelle du Covid-19 en Espagne
Le bétacoronavirus SARS-CoV-2 a été identifié comme l’agent causal d’une épidémie mondiale sans précédent de pneumonie à partir de décembre 2019 dans la ville de Wuhan (Chine) [1], nommé Covid-19. Considérant que de nombreux cas se déroulent sans développer de symptômes ou simplement avec des symptômes très légers, il est raisonnable de supposer que l’incidence de cette maladie a été sous-enregistrée. Ce travail se concentre sur l’incidence hebdomadaire de Covid-19 enregistrée en Espagne au cours de la période (2020/02/23–2022/02/27). On peut voir sur la Fig. 1 que les données enregistrées (turquoise) ne reflètent qu’une fraction de l’incidence réelle (rouge). La zone grise correspond à 95 % de probabilité de la distribution a posteriori du nombre hebdomadaire de nouveaux cas (les bornes inférieure et supérieure de cette zone représentent respectivement le centile 2,5 % et 97,5 %), et la ligne pointillée rouge correspond à sa médiane.
Au cours de la période considérée, les sources officielles ont signalé 11 056 797 cas de Covid-19 en Espagne, tandis que le modèle prédit un total de 21 639 627 cas (seulement 51,10 % des cas réels ont été signalés). Ce travail a également révélé que si la fréquence de sous-déclaration est extrêmement élevée pour toutes les régions (valeurs de (widehat{omega }) supérieure à 0,80 dans tous les cas), l’intensité de cette sous-déclaration n’est pas uniforme dans les régions considérées : Aragón et Ceuta sont les ZACC avec l’intensité de sous-déclaration la plus élevée ((widehat{q}=0.28)) tandis que Región de Murcia et País Valencià sont les régions où les valeurs prédites sont les plus proches du nombre de cas signalés ((widehat{q}=0.46)). Les estimations détaillées des paramètres de sous-déclaration pour chaque région se trouvent dans le tableau 2. Bien que l’impact principal des programmes de vaccination puisse être observé dans les données sur la mortalité, les résultats de ce travail ont également montré une diminution significative du nombre hebdomadaire de cas ainsi que dans toutes les CCAA. sauf Euskadi, comme on peut également le voir dans le tableau 2 à travers les estimations correspondant au paramètre ({bêta}_{2}). La figure 2 représente l’incidence hebdomadaire prévue et enregistrée de Covid-19 dans le monde pour l’Espagne.
La figure 2 montre l’évolution du nombre hebdomadaire enregistré (turquoise) et prévu (rouge) de cas de Covid-19 en Espagne au cours de la période 2020/02/23–2022/02/27.
Comme on peut le voir sur les Fig. 1 et 2, il y a 4 semaines (2021-12-26, 2022-01-02, 2022-01-09 et 2022-01-16) pour lesquelles les valeurs prédites coïncident avec celles enregistrées dans toutes les simulations, donc aucune sous-déclaration n’est détecté ces semaines. Ce comportement pourrait être dû à l’apparition d’une nouvelle variante avec des caractéristiques différentes (par exemple produisant plus de cas symptomatiques et donc réduisant la sous-déclaration) autour de ces dates.
Les valeurs enregistrées prédites par le modèle peuvent également être obtenues comme (widehat{Y_t}=left(1-widehatomega+widehatomegacdotwidehat qright)cdotwidehat{X_t})et comparé aux valeurs réelles enregistrées ({Yt}). Cela permet de calculer les mesures d’erreur de prévision standard sous forme d’erreur quadratique moyenne (RMSE) ou d’erreur absolue moyenne en pourcentage (MAPE). À l’échelle mondiale, le RMSE était de 113 145,4 et le MAPE était d’environ 8 %, variant entre 4 et 13 % selon les régions. Le RMSE et le MAPE spécifiques pour chaque région sont décrits dans le tableau S1 du matériel supplémentaire.
Les différences globales dans l’ampleur de la sous-déclaration entre les régions peuvent être représentées par le pourcentage de cas signalés dans chaque ACCA (par rapport aux estimations du modèle), comme le montre la Fig. 3.