Corrections pour R et Espace

La fonction plot() appliquée aux résultats d’un modèle de régression
linéaire obtenus par la fonction lm() permet de représenter les quatre
principales hypothèses au cœur de ce modèle :
— la normalité des résidus par rapport aux valeurs prédites (en haut à
gauche de l’image)
— la normalité globale des résidus (en haut à droite de l’image)
— la corrélation entre les valeurs de la variable explicative et le carré
des résidus standardisés (en bas à gauche de l’image)
— l’existence de valeurs extrêmes altérant l’estimation des paramètres
(en bas à droite de l’image)

Je préférerai :

La fonction plot() appliquée aux résultats d’un modèle de régression
linéaire obtenus par la fonction lm() permet de représenter les quatre
principales hypothèses au cœur de ce modèle :
— l'absence de relation entre les résidus et les valeurs prédites (en
haut à
gauche de l’image)
— la normalité globale des résidus (en haut à droite de l’image)
— l'absence de corrélation entre les valeurs de la variable
explicative et la racine carré
des résidus standardisés, ce qui correspond à l'htypothèse
d'homoscédasticité (en bas à gauche de l’image)
— l’absence de valeurs extrêmes altérant l’estimation des paramètres
(en bas à droite de l’image)

car le 1er plot du lm est plutot utilisé pour l'hypothèse que E(sigma | X) = 0 (qui est d'ailleurs un hypothèse plus importante que celle d'homoscédasticité : l'hétéroscédasticité ne concerne que l'estimation des variances des estimateurs alors que l’existence d'un biais, biaise estimations et variances des paramètres d'un modèle linéaire). L'homoscédasticité peut se voir sur le premier plot (forme de cône par exemple en cas d'hétéroscdaticté), mais il faut mieux préféré le 3e, car les résidus standardisés sont faits pour être comparés à des écarts-types. Cet article est pas mal sur les graphiques de diagnostic d'un modèle linéaire : www.r-bloggers.com/model-validation-interpreting-residual-plots/

Note : en cas d'hétéroscédasticté, on peut utiliser la correction de White : coeftest(monObjetLM, vcov. = vcovHC) . Je crois que ça dépend du paquet sandwich et/ou lmtest