Parmi les différentes manières d'échantillonner dans une base de données, on distingue entre autres l'échantillonnage aléatoire simple (simple random) et l'échantillonnage stratifié (stratified).
![]() |
![]() |
|
| Ici (cas aléatoire simple), on prend dans l'ensemble de la base de données un nombre d'individus choisis complètement au hasard. On n'a aucune garantie qu'un minimum d'individus présentant un critère particulier soit représenté. | Ici (cas stratifié), on découpe la population en parcelles identifiées par les valeurs d'une certaine caractéristique. Ces parcelles sont les strates. On tire avec le mode aléatoire simple dans chaque strate, garantissant ainsi la présence minimum d'individus de chaque catégorie. L'échantillon final est la réunion des différents sous-échantillons. |
Nous allons exploiter une telle méthode d'échantillonnage, en stratifiant par rapport à la variable cible. Il ne restera qu'à requérir des sous-échantillons de tailles égales afin d'obtenir des données équilibrées.
![]() |