In:

g. valeur ordonnée et honcomp – la valeur ordonnée fait référence à la façon dont SAS commande/modélise les niveaux de la variable dépendante. Lorsque nous avons spécifié l`option descendante dans l`instruction de procédure, SAS traite les niveaux d`honcomp dans un ordre décroissant (élevé à faible), de telle sorte que lorsque les coefficients de régression logit sont estimés, un coefficient positif correspond à une relation positive pour l`état d`écriture élevé, et un coefficient négatif a une relation négative avec l`état d`écriture élevé. Une attention particulière doit être accordée à la valeur ordonnée, car elle peut conduire à une interprétation erronée. Par défaut, les modèles SAS sont les 0s, tandis que la plupart des autres packages de statistiques modélise les 1s. L`option descendante est nécessaire pour que SAS modélise les 1. Dans la sortie ci-dessus, nous voyons que toutes les observations 400 dans notre ensemble de données ont été utilisées dans l`analyse. Moins d`observations auraient été utilisées si l`une de nos variables avait des valeurs manquantes. Par défaut, SAS effectue une suppression listwise des cas avec des valeurs manquantes. Le profil de réponse affiche la valeur que SAS a utilisée lors de la réalisation de l`analyse (donnée dans la colonne valeur ordonnée), la valeur de la variable d`origine et le nombre de cas dans chaque niveau de la variable de résultat. (Si vous souhaitez que SAS utilise les valeurs que vous avez affectées à la variable de résultat, vous souhaiterez utiliser l`option Order = Data sur l`instruction proc Logistic.) La note en dessous de ce tableau nous rappelle que «les probabilités modélisées se cumulaient sur les valeurs ordonnées inférieures». Il est utile de se rappeler cela lors de l`interprétation de la sortie. Ensuite, nous voyons que le modèle convergé (vous ne devriez pas essayer d`interpréter toute sortie si le modèle n`a pas convergé), et nous voyons aussi que le test de l`hypothèse de cotes proportionnelles est non significatif.

L`une des hypothèses sous-jacentes à la régression de la logistique ordinale (et probit ordinale) est que la relation entre chaque paire de groupes de résultats est la même. En d`autres termes, la régression logistique ordinale suppose que les coefficients qui décrivent la relation entre, disons, la plus faible par rapport à toutes les catégories supérieures de la variable de réponse sont les mêmes que ceux qui décrivent la relation entre la prochaine plus basse catégorie et toutes les catégories supérieures, etc. C`est ce qu`on appelle l`hypothèse de cotes proportionnelles ou l`hypothèse de régression parallèle. Étant donné que la relation entre toutes les paires de groupes est la même, il n`y a qu`un seul ensemble de coefficients (un seul modèle). Si ce n`était pas le cas, nous aurions besoin de modèles différents (comme un modèle logit ordonné généralisé) pour décrire la relation entre chaque paire de groupes de résultats. Le tableau montrant les statistiques de l`ajustement du modèle fournit la probabilité de log AIC, SC et-2. Ceux-ci peuvent être utilisés dans la comparaison des modèles imbriqués. Dans le tableau suivant, nous voyons différents tests du modèle global; ils ont tous indiqué que le modèle est statistiquement significatif. Examinez le tableau “informations sur le modèle” pour connaître le nombre de colonnes dans les matrices et. Un grand nombre de colonnes dans l`une ou l`autre matrice peut augmenter considérablement le temps de calcul. Vous voudrez peut-être éliminer certains effets d`ordre supérieur s`ils sont trop volumineux. e.

technique d`optimisation – il s`agit de la méthode itérative d`estimation des paramètres de régression. Dans SAS, la méthode par défaut est la méthode de notation de Fisher, alors que dans stata, c`est l`algorithme Newton-Raphson. Les deux techniques donnent la même estimation pour le coefficient de régression; Cependant, les erreurs standard diffèrent entre les deux méthodes. Pour plus d`analyse, voir modèles de régression pour les variables dépendantes catégorielles et limitées par J. Scott long (page 56). L`ensemble de données contient des variables sur 200 étudiants.