skip to content

Sélection de cas

Pour certaines analyses, il peut être nécessaire de filtrer une partie des observations pour obtenir des résultats auprès d'un sous-groupe spécifique de cas.

Il est possible de sélectionner un ou des cas à l’aide de un ou d'une combinaison de critères, soit par la boite de dialogue, soit en utilisant une commande SYNTAX. 

Les conditions de sélection peuvent être uniques ou multiples. Dans le cas d’une seule condition, on inscrit la variable sur laquelle repose la sélection avec la condition formulée grâce aux conditions arithmétiques (<, >, =, <=, >=, <>). 

Toutes les conditions multiples (deux variables ou plus) doivent utiliser les opérateurs logiques (AND et OR) pour séparer les conditions.

  

1.       Pour faire une sélection de cas de manière interactive, allez dans le menu Data, puis sélectionnez Select Cases.


 

2.      Dans la première boite de dialogue, vous devez déterminer la stratégie de sélection que vous allez utiliser. Vous avez plusieurs choix, mais le plus populaire est sans contredit If condition is satisfied : si une condition est remplie, la sélection se fait à partir de la condition que vous énoncez). Nous allons donc voir cette stratégie en premier et préciser les autres par la suite.


3.    Vous cliquez donc sur le bouton . Une nouvelle boite de dialogue apparaît. Vous devez préciser les conditions de sélection dans la boite supérieure droite. Vous transférez le nom des variables à l'aide du bouton après les avoir mises en surbrillance dans la boite de gauche.

 

Vous pouvez taper les conditions arithmétiques et les nombres à partir du clavier ou en cliquant sur les boutons appropriés à l'aide de la souris. Vous aurez compris que les opérateurs logiques doivent être entrés manuellement.

 

Exemple: pour choisir les hommes de plus de 30 ans, on entrerait dans la boite

Sexe  =  1    AND    age  >  30


 

Si vous préférez taper la commande manuellement, vous devriez créer la syntaxe suivante :

 

4.    Quand votre condition est entrée, cliquez sur pour revenir à la première boite de dialogue. Vous pourrez alors remarquer que la condition que vous venez d'énoncer est indiquée à côté du bouton .


5.    Dans le deuxième encadré (Output), vous choisissez ce qui se passera avec les cas qui ne sont pas retenus par la sélection. Vous pouvez les filtrer temporairement (Filter out unselected cases),  ou les éliminer de manière permanente (Delete unselected cases). Si ces deux possibilités ne vous conviennent pas, vous pouvez également copier les cas retenus dans un nouveau fichier (Copy selected cases to a new dataset). À ce moment, vous devez préciser le nom du nouveau fichier de données. Dans le cas présent, nous conservons l’option par défaut, c’est-à-dire le filtre.

6.      Cliquez sur pour réaliser votre sélection de cas.

Les conditions de sélection peuvent être très complexes. Cette complexité dépend des caractéristiques des sujets que nous voulons filtrer. Voici quelques exemples de conditions de sélection qui seraient écrites dans la boite de commande.

 

On pourrait désirer isoler seulement quelques sujets dont on connait les numéros :

(identif = 1) or (identif = 3) or (identif = 8)

Ce qui donnerait :


 

Êtes-vous capable d’exprimer en mots la condition de sélection suivante ?

 

 
Alors vous diriez... que nous voulons isoler les variables qui n'ont aucune valeur manquante pour les six questions de satisfaction !!

 

Les autres stratégies de sélection

Dans la boite de dialogue Select Case, vous avez bien sûr la stratégie If que nous venons de voir, mais aussi d’autres choix. Voici une brève description pour chacun.

 

All cases : tous les cas, vous ne faites pas de sélection.

Random sample of cases : sélection de cas aléatoire. Vous choisissez à ce moment combien de cas vous voulez dans votre échantillon, soit en pourcentage (Approximately _ % of all cases), soit en précisant un nombre de cas parmi les X premiers (Exactly _ cases from the first _ cases).

 

Based on time or case range : la sélection se fait parmi un intervalle. Vous pouvez par exemple vouloir que les cas sélectionnés se situent seulement entre le 2e et le 6e cas.

 

Use filter variable : enfin, vous pouvez faire une sélection en ne conservant que les cas qui ont des valeurs valides pour une variable filtre. Vous n'avez qu'à transférer la variable filtre dans la boite prévue à cet effet.

 


Haut de page