Bootstrap et SAS Enterprise Miner
Quel(s) bootstrap(s) sous SEM ?
Enterprise Miner propose deux méthodes de "bootstrap", c'est à dire,
en l'occurence, de modèles itérés. On ne peut pas parler
réellement de bootstrap dans ce cas, puisque SEM ne propose aucune estimation
d'intervalles de confiance pour les différents paramètres des modèles
mis en oeuvre. D'ailleurs, l'aide d'Enterprise Miner fait plutôt références
aux techniques connues sous le nom d'ARCING (Adaptive Resampling and CombinING),
qui proposent une palette de méthodes pour combiner les modèles
itérés.
- ARCING à probabilités égales (BAGGING ou Bootstrap
AGGregatING) : tous les modèles sont réalisés sur des
échantillons tirés au hasard dans la population d'étude.
- ARCING à probabilités inégales (BOOSTING) :
chaque modèle est calculé sur une population issue de la population
d'étude, où les individus sont d'autant plus représentés
qu'ils ont été mal représentés à l'étape
précédente.
Principe du boosting dans la modélisation...
Etape 1 |
Etape 2
|
Légende : dans la seconde étape, la ligne maigre rappelle
le premier modèle. Les points grisés ont été exclus
par un nouveau tirage. Les points noirs sont conservés.
Ici, dans le cas d’une modélisation linéaire, on voit que les
laissés pour compte proposent un tout autre modèle, et en mettant
les choses à l’extrême (on ne conserve plus qu’eux dans la seconde
étape), on obtient un modèle bootstrapé qui ne satisfait
personne. Il convient donc de manipuler cette méthode avec beaucoup de
circonspection, et de ne mettre en œuvre avec cette méthode qu’un très
faible nombre de boucles.