SURISTATLe portail des enquêtes en ligne et de l'analyse de donnéesSuristat
 Suri qui ? MéthodologieMédiaRessources
Site en français
English website
 
 Espaces dédiés
Bloqué(e) dans le cadre d'une de vos études ou de vos recherches ? Besoin de vous rafraîchir la mémoire ou de vous perfectionner ?
L'information ou l'outil dont vous avez besoin est sans doute sur Suristat !
 
IdentifiantMot de passe 
Accueil > Méthodologie > Collecter > L'échantillonnage > Le "Bootstrap"S'inscrire
Le "Bootstrap"
Le bootstrap est aujourd’hui une technique fréquemment utilisée en inférence statistique. Très souple à mettre en oeuvre, elle constitue une alternative intéressante aux méthodes d’estimation classiques surtout lorsque ces dernières ne peuvent être appliquées. Cependant, sa gourmandise en temps de calcul reste le principal frein à la généralisation de son utilisation.

Par Christian CAPARIN

Les premiers éléments de la technique du bootstrap sont assez récents : ils sont apparus dans la littérature statistique en 1979. Toutefois, il faut attendre 1993 pour voir paraître le livre d’Efron qui fait aujourd’hui encore référence sur le sujet. Le récent développement de la puissance de calcul des ordinateurs a permis à cette technique de s’imposer comme une alternative intéressante aux méthodes classiques.

Position du problème

La statistique est « l’ensemble de techniques d’interprétation mathématique appliquées à des phénomènes pour lesquels une étude exhaustive est impossible à cause de leur grand nombre et de leur complexité ». Dit de façon un peu plus mathématique, le problème du statisticien est de définir des hypothèses, de choisir un modèle qui dépendra d’un certain nombre de paramètres, d’estimer ces derniers et de vérifier le modèle en appliquant des tests sur les paramètres.
Un certain nombre de méthodes d’estimation ont été développées afin de réaliser l’ensemble des tâches précédemment énoncées. On peut penser, entre autres, au Maximum de Vraisemblance, à la méthode des moments généralisés, aux estimateurs des Moindres Carrés Ordinaires. Toutefois, ces méthodes sont rapidement mises en défaut lorsque certaines hypothèses techniques ne sont plus vérifiées – nombre d’observations insuffisant, hypothèse de normalité non acceptable-, restreignant par conséquent leur champ d’application.

Le Bootstrap…

Les techniques de bootstrap interviennent justement lorsque le champ du problème considéré n’est pas couvert par des méthodes classiques ou que les conditions d’application de ces dernières ne sont plus valables.

L’idée est d’utiliser l’échantillon des observations pour permettre une inférence statistique plus fine. On réalise un certain nombre d’échantillons – qualifiés d’échantillon bootstrap- obtenus par tirage aléatoire d’observations de l’échantillon initial. Sur chacun des échantillons bootstrap, on estime les différents paramètres du modèle. On obtient par conséquent une suite de paramètres. Sous certaines conditions de régularité, la théorie montre que la distribution de la suite de paramètres obtenus converge vers la réelle distribution du paramètre.
Cette dernière propriété théorique a donc favorisé l’utilisation des techniques bootstrap dans plusieurs problèmes classiques d’estimation :
  1. L’estimation des erreurs des modèles
  2. L’estimation des intervalles de confiance
  3. L’estimation des biais des estimateurs
Très pratique mais très coûteux

Le bootstrap s’est aujourd’hui imposé dans le domaine statistique comme une technique très pratique d’inférence statistique. Elle nécessite, en effet, « peu » d’hypothèses et est relativement facile à programmer – ce ne sont, en effet, que des tirages aléatoires.
Toutefois, le gros inconvénient réside dans les importantes capacités de calcul que l’application de ces techniques exige. A chaque fois qu’un échantillon bootstrap est constitué, une étape d’estimation des paramètres doit être réalisée : par conséquent, si une étape d’estimation dure une semaine, la réalisation de 50 échantillons bootstrap nécessitera une année. Cette gourmandise en CPU est d’autant plus gênante, que certaines expériences montrent la nécessité de beaucoup d’échantillons bootstrap pour avoir une bonne convergence.
Pour ou contre le bootstrap ? Disons qu’il vaut mieux éviter d’utiliser le bazooka pour écraser la mouche. Dans un premier temps, il est nécessaire de voir si des méthodes « classiques » ne donnent pas satisfaction. Si ce n’est pas le cas, le recours au bootstrap peut constituer une solution. Toutefois, le temps de calcul exigé par chaque étape d’estimation devra être un facteur dont il faudra tenir compte.

________________________________________
Pour En Savoir Plus
Irène BUVAT Introduction à l'approche bootstrap 2000
Cette présentation Powerpoint fait une description du Bootstrap. L'intérêt de ce document réside dans la simplicité de l'exposé et l'exhaustivité en ce qui concerne les applications de la méthode.
A.C. DAVISON et Diego KUONEN An introduction of Bootstrap with applications in R 2003
Cet article traite de la programmation du bootstrap avec R, le logiciel freeware en statistique. Il propose une présentation théorique de la technique accompagnée d'exemples d'utilisation avec R.
 
simulation flash
ENQUETES WEB
Sphinx Online vous accompagne de la conception d'enquête à l'interprétation des données.

>> Enquêtes Web
>> Reporting
Suristat Le portail des enquêtes et de l'analyse de données· © 2007
Tous droits réservés. Pix-m.com
Mentions légales | Contact | Webmestre