skip to content

Procédure SPSS

1.   Pour réaliser une régression logistique, cliquez sur Analyze, Regression, Binary Logistic.

  

2.    Dans la première boîte de dialogue, insérez la variable dépendante dichotomique dans la boîte Dependant et les variables prédictrices dans la boîte Covariates.

 

3.    Si vous désirez insérer un terme d’interaction entre deux prédicteurs, sélectionnez les deux variables dans la boite de gauche et cliquez sur le bouton .

 

4.       Choisissez ensuite la méthode de régression :

 
 

5.       Pour réaliser l’analyse, cliquez sur .

 

 

Le bouton

Comme pour plusieurs types d’analyse, il est possible d’enregistrer en tant que nouvelles variables certaines informations d’intérêt, telles que les résiduels standardisés (Residuals - Standardized), les prévisions probabilités (valeurs P(Y) prédites à partir de l’équation) (Predicted Values - Probabilities) et les prévisions groupe d’affectation (prédiction du groupe dans lequel les individus seront inclus en fonction du modèle) (Predicted Values - Group membership).

Il est également possible d’obtenir les autres formes de résidus et les statistiques d’influence présentées dans la régression simple. Le résidu logit est calculé à partir des coefficients logit.

Ces nouvelles variables serviront essentiellement à examiner la qualité d’ajustement du modèle.

 
 
 

 

Le bouton

Le dernier bouton comprend les options pour réaliser l’analyse ainsi que les les tableaux qui peuvent s’afficher dans les résultats. Il faut conserver les options par défaut.

Probabilité pas à pas (Probability for Stepwise) : comprend les points de coupure pour la sélection des variables dans les méthodes progressives. Idéalement, on maintient le critère à 0,05 pour l’ajout des variables et à 0,10 pour le retrait.

Maximum des itérations (20) (Maximum Iterations) : représente le nombre d’essais maximal que SPSS utilisera pour identifier le meilleur modèle possible à partir des variables disponibles. À moins d’avoir un modèle excessivement complexe, ça ne devrait pas prendre plus de 20 essais.

Inclure le terme constant dans le modèle (Include constant in model) : l’équation comprend le coefficient b0, ce qui favorise un modèle mieux ajusté aux données.

 
 
 

Les autres options disponbiles peuvent aussi être pertinentes.

Diagramme de classement (Classification plots) : histogramme illustrant les valeurs prédites et observées. Il permet de juger l’ajustement du modèle.

Qualité de l’ajustement de Hosmer-Lemeshow (Hosmer-Lemeshow goodness-of-fit) : test évaluant s’il y a une différence significative entre les valeurs observées et les valeurs prédites. Évidemment, on préfère que ce test soit non significatif.

Liste des résidus par observation (Casewise listing of residuals) : soit pour les valeurs extrêmes (situées à plus de 2 écarts-types, il est toutefois possible de changer le critère), soit pour toutes les observations. On cherche dans ce cas, comme pour la régression multiple, à ce qu’il y ait moins de 1 % de l’échantillon qui se situe à plus de 2 écarts-types ou moins de – 2 écarts-types.

Corrélation des estimations (Correlations of estimates): tableau de corrélation entre les paramètres estimés des termes dans le modèle. Cette option n’est pas nécessaire.

Historique des itérations (Iteration history) : tableau indiquant les valeurs de la probabilité log à chaque essai d’ajustement du modèle.

CI pour exp(b) : intervalles de confiance pour le coefficient exp(b).

Afficher : vous décidez dans cet encadré si vous désirez obtenir les statistiques et diagrammes pour chaque étape du modèle ou seulement pour le modèle final. Idéalement, vous demandez les statistiques à chaque étape pour voir la progression.

 

Haut de page