Le bootstrap

applications,

explications

et programmes

Applications

Le bootstrap est une technique statistique qui poursuit deux buts :

Cette méthode est particulièrement utile dans le cadre d'une étude de type CRM. Elle permet d'évaluer et de combattre les pertes d'efficacité d'un score face à des prospects de profil inconnu.

Haut de la page

Explications

Cliquez [ici] pour visualiser en ligne le diaporama de notre exposé (ssorti de ses commentaires) du Club SAS 2003, en compagnie de Nicolas DESPIEGEL de la firme Lundbeck.

Nous y présentons les grands principes du bootstrap et les variantes les plus communes :

Ces variantes du bootstrap font l'objet des programmes téléchargeables ci-dessous...

Principe et utilité du bootstrap

Le bootstrap est une méthode proposée à la fin des années 70 par Bradley Efron ; son but est de fournir des indications sur une statistique autre que sa valeur (dispersion, distribution, intervalles de confiance) afin de connaître la précision des estimations réalisées. Ces informations sont obtenues sans recours à de nouvelles observations.

Dans le cadre des statistiques classiques, le bootstrap est déjà une aide précieuse aux chargés d'études, qui n'ont pas à se débattre avec des formules complexes (la variance d'un estimateur est rarement simple à expliciter). Dans le cadre du DataMining, le bootstrap permet d'engendrer des modèles plus robustes, c'est à dire aux performances d'un niveau sensiblement constant face à des données inconnues.

Cette méthode s'organise autour d'une technique de rééchantillonnage, accompagnée d'un "grand" nombre d'itérations qui résultent de l'application de la méthode de Monte-Carlo.

 

Haut de la page

Programmes

La quantité de programmes nous oblige à les classer en catégories. Cliquez sur les noms pour visualiser et/ou télécharger (avec clic droit > Enregistrer la cible sous) les programmes.

Remarques importantes :

Bootstraps pour les intervalles de confiance
Bootstrap pour les taux de classement
Bagging et boosting
Programmes utilitaires
  • calcul : exemple de calcul de statistique pour le bootstrap d'intervalles de confiance
  • classif .632 : à adapter à votre problématique pour un bootstrap .632
  • complete : utilitaire pour la bonne exécution du bootstap .632
  • jackknifeBCa : programme de jackknife utilisé pour le bootstrap .632 (peut également être utilisé seul pour faire du jackknife)
  • modele : utilitaire de calcul pour le bagging
  • modeleBoost : utilitaire de calcul pour le boosting
  • visuHisto : utilitaire permettant de visualiser la distribution des statistiques plug-in

SAS Enterprise Miner permet également d'utiliser le bootstrap sur les noeuds de modélisation, sans que l'utilisateur ait à mettre en oeuvre du code SAS. L'emploi des noeuds SAS nécessaires est décrit [ici].

Bon courage dans votre application du bootstrap.

Haut de la page