Outils pour utilisateurs

Outils du site


framabookrespace

Corrections pour R et Espace

  • manque une parenthèse à la définition du I de Moran page 226
  • page97 : « — la corrélation entre les valeurs de la variable explicative et le carré des résidus standardisés (en bas à gauche de l’image) » à remplacer par « — la corrélation entre les valeurs de la variable explicative et la racine carré des résidus standardisés (en bas à gauche de l’image) »
  • page 91 : « Le paramètre b0 informe sur la valeur théorique de la densité de population lorsque la distance au centre de Paris est égale à 0. » –> Le paramètre b0 informe sur la valeur théorique du logarithme de la densité de population lorsque la distance au centre de Paris est égale à 0.
  • page 92 : sur les plot de diagnostic d'un modèle linéaire c'est pas tout à fait exact.
La fonction plot() appliquée aux résultats d’un modèle de régression
linéaire obtenus par la fonction lm() permet de représenter les quatre
principales hypothèses au cœur de ce modèle :
— la normalité des résidus par rapport aux valeurs prédites (en haut à
gauche de l’image)
— la normalité globale des résidus (en haut à droite de l’image)
— la corrélation entre les valeurs de la variable explicative et le carré
des résidus standardisés (en bas à gauche de l’image)
— l’existence de valeurs extrêmes altérant l’estimation des paramètres
(en bas à droite de l’image)

Je préférerai :

La fonction plot() appliquée aux résultats d’un modèle de régression
linéaire obtenus par la fonction lm() permet de représenter les quatre
principales hypothèses au cœur de ce modèle :
— l'absence de relation entre les résidus et les valeurs prédites (en
haut à
gauche de l’image)
— la normalité globale des résidus (en haut à droite de l’image)
— l'absence de corrélation entre les valeurs de la variable
explicative et la racine carré
des résidus standardisés, ce qui correspond à l'htypothèse
d'homoscédasticité (en bas à gauche de l’image)
— l’absence de valeurs extrêmes altérant l’estimation des paramètres
(en bas à droite de l’image)

car le 1er plot du lm est plutot utilisé pour l'hypothèse que E(sigma | X) = 0 (qui est d'ailleurs un hypothèse plus importante que celle d'homoscédasticité : l'hétéroscédasticité ne concerne que l'estimation des variances des estimateurs alors que l’existence d'un biais, biaise estimations et variances des paramètres d'un modèle linéaire). L'homoscédasticité peut se voir sur le premier plot (forme de cône par exemple en cas d'hétéroscdaticté), mais il faut mieux préféré le 3e, car les résidus standardisés sont faits pour être comparés à des écarts-types. Cet article est pas mal sur les graphiques de diagnostic d'un modèle linéaire : www.r-bloggers.com/model-validation-interpreting-residual-plots/

Note : en cas d'hétéroscédasticté, on peut utiliser la correction de White : coeftest(monObjetLM, vcov. = vcovHC) . Je crois que ça dépend du paquet sandwich et/ou lmtest

framabookrespace.txt · Dernière modification: 2015/05/07 13:49 (modification externe)