Qu'est-ce que le bootstrap en statistiques?
- Marilyse Julien
- 16 janv. 2021
- 1 min de lecture
Dernière mise à jour : 17 janv. 2021
La technique de bootstrap (ou rééchantillonnage) est notamment utilisée pour calculer l’écart type d’une statistique complexe ou peu commune (par exemple l'écart type de la médiane, d'un quantile, de l’aire sous une courbe ROC pour mesures répétées…).
En général, par bootstrap, on réfère à la technique qui consiste à « RÉ-échantillonner » à l’intérieur d’un échantillon. Ainsi, l’échantillon de départ est en quelques sortes considéré comme une « population » de laquelle est tirée une série d’échantillons.
La première étape consiste à tirer avec remise plusieurs « rééchantillons » de grandeur identique à l’échantillon de départ. 200 rééchantillons sont généralement suffisants. On estime ensuite l'écart type de notre statistique par l'écart type des statistiques des rééchantillons (par exemple l'écart type des médianes des rééchantillons).

Si l'on souhaite construire un intervalle de confiance, on peut faire un histogramme à partir des statistiques des rééchantillons et vérifier s’il possède une forme approximativement normale. Dans ce cas, on pourra utiliser les propriétés de la loi normale et calculer un intervalle de confiance pour le paramètre en utilisant la forme M±1.96xE où M est la moyenne de la statistique considérée et E est l'écart type de cette statistique.
Post inspiré de : http://www.stat.wisc.edu/~larget/math496/bootstrap.html
Comments