Série 2 - S&E II
Exercice 4c - Montrer que si le modèle contient une constante, alors la moyenne des résidus estimés est de zéro.
Somme des erreurs s'annulent, donc la moyenne est nulle aussi -> Comme 2a
Exercice 4d (2/2) - Montrer que si les colonnes de X sont orthogonales, l'estimateur de βj de l'Eq. (2) correspond à celui de βj quand yi = βjxi,j + ui,i=1,...,n.
-> Faire produit matriciel de (X'X)^-1 ' X'y -> On trouve les "bK" -> identique à la forme non-matricielle
Exercice 2e - Donner un intervalle de confiance à 95% (approché) de β2. Vous expliquerez brièvement pourquoi vous pouvez calculer un tel intervalle de confiance dans le cas présent.
-> Simple formule de l'IC -> On a "n-k" d.d.l. , donc 200-2 = 198 d.d.l -> tend vers normale
Exercice 4d (1/2) - Montrer que si les colonnes de X sont orthogonales, l'estimateur de βj de l'Eq. (2) correspond à celui de βj quand yi = βjxi,j + ui,i=1,...,n.
Orthogonalité de colonnes = le produit matriciel de deux colonnes qui ne concernent pas le même individu sont nules -> En conséquence, seule la diagonale (produit matricielle de deux colonnes qui concernent uniquement le même individu contient des valeurs non-nulles. -> Développer le produit matriciel X'y de l'estimateur "b"
Exercice 3c - Montrer que ∑(yi - ybar)^2 = ∑(yi - y^)^2 + ∑(y^ - ybar)^2
1. Comme série 1 3b, ajouter/soustraire estimateur, puis développer multiplication. 2. Dans dernier terme, mettre en avant a) ei b) x'i'b (= vecteur ligne (colonne transposé) des observations pour un individu "i" multiplié par le vecteur colonne des coefficients) 3) Dans les deux termes, annuler a) Sommation disparaît; ei * xi' -> e'X = X'e ; somme des erreurs nulles b) sortir y‾ de la sommation; somme des erreurs nulles
Exercice 2a - Les valeurs estimées par OLS des résidus εi sont notées ei. Montrer que la moyenne des erreurs est nulle
1. Développer " X'e " à travers "e", puis "b" -> = 0 (vecteur) 2. Mettre en évidence le produit scalaire de la première colonne de X ([1 1 ... 1]) et des résidus est nul. Si ∑xi1'e = 1'e = ∑e = 0 -> e‾ = 0
Exercice 3a - Montrer que l'hyperplan de la régression passe par la moyenne des donnéess, i.e. y ̄ = x ̄ ′ b .....
1. Multiplier la relation y = Xb + e par " 1/n * x1i' " 2. Isoler pour avoir vecteur-ligne des moyennes 3. Utiliser x1i'e = 0 (erreur moyenne nulle)
Exercice 2b - Montrer que si E(ε|X) = 0, alors l'estimateur OLS de β est non biaisé.
1. Remplacer "y" par sa vrai valeur dans "b" 2. Utiliser L.E.I. dans E[b|X]
Exercice 3b - Montrer que la moyenne des valeurs estimées (= Xb) est égale à la moyenne des valeurs réelles, i.e. y ̄ = 1/n * ∑i y^i
= même réponse que 3a
Exercice 2c - La corrélation entre xi,2 et xi,3 est de 0.98. Qu'est-ce que cela implique pour l'estimateur "b"? (Il n'est pas demandé de faire de calculs ici, une explication brève est suffisante.)
C'est une situation dite de "multicolinéarité". L'estimateur peut être calculé (car(X′X)−1 existe), mais les écarts-types de b2 et b3 seront très grands.
Exercice 4b - Montrer que les résidus estimés sont orthogonaux aux variables explicatives. (produit scalaire de X'e = 0 -> orthogonalité )
Chaque colonne de la matrice des variables, c.à.d. toutes les observation d'un individu, est également orthogonales aux erreurs. -> Comme 2a
Exercice 3c - déduire que le R^2 prend des valeurs entre 0 et 1
Diviser résultat précédent par variance total R^2 = SSE/TSS = 1 - SSR/TSS -> SSR/TSS > 0
Exercice 2d - Donner une estimation de Var(b2).
Variance de "b" = σ(X'X)^-1 -> σ est approximé par s = e'e/(n-2) -> (X'X)^-1 est une matrice diagonale Nous sommes intéressé par b2 (et non le vecteur "b" en entier") donc par l'élément de 2;2 de la matrice diagonale " (X'X)^(-1) "