La funzione di regressione in analisi statistica è una funzione ideale . Quando si lavora con i dati reali , statistici sperano di utilizzare la funzione di regressione per modellare i dati di interesse . Tuttavia, vi è errore – punto dati necessari per raccogliere i dati di esempio che sarà oggetto di regressione . Pertanto , è spesso importante per statistici per tenere conto di questo errore nel modello di regressione stesso. Mentre è impossibile calcolare i veri valori dell’errore punti dati, è possibile stimare loro e incorporare nel modello di regressione . Istruzioni

1

organizzare i dati in una matrice di dati preparata per la regressione . La matrice di dati dovrebbe essere di dimensione n da p , dove n è il numero di punti dati e p è il numero di variabili indipendenti nel modello . Ad esempio, se i dati inclusi 336 soggetti che sono stati misurati in 12 diverse variabili (criteri) , si avrà una matrice di dati con 336 righe e 12 colonne . Chiamare questo X. matrice

2

Eseguire un modello di regressione come al solito . Utilizzare software statistico . Ad esempio , nel pacchetto software statistico R , il comando lm ( Y ~ X ) regredisce la variabile dipendente Y delle variabili indipendenti X. Il risultato sarà una lista di coefficienti . Metterli in forma vettoriale e li chiamano B.

3

Trasposizione X. matrice Nella trasposizione della matrice , le righe diventano colonne e le colonne diventano righe. Così, vi ritroverete con un p da matrice n . Chiamare questa matrice X ‘ . Per grandi matrici , si consiglia di trovare X ‘ attraverso il software statistico . Ad esempio , nel pacchetto software R , il comando t ( X ) produce la trasposta di X.

4

Moltiplicare la trasposta di X da X stesso . In questo calcolo , l’ordine conta . Pertanto , l’informatica X’X è corretto , mentre XX ‘non è . Per le grandi matrici si dovrebbe eseguire questo calcolo nel software statistico . Se si utilizza R , per esempio , utilizzare% * % per moltiplicare due matrici . Così, il comando è X ‘ % * % X.

5

Trovare l’inversa di X’X . Questo calcolo è fattibile a mano , in modo da utilizzare il software statistico . In R , il comando di questo è inv ( ) . Quindi , questo passaggio viene eseguita inv ( X’X ) . Chiamare questa matrice ( X’X ) -1 .

6

Calcola la matrice di cappello. La matrice cappello è data dalla formula X ( X’X ) – 1X ‘ . Cioè , moltiplicare X di ( X’X ) -1 e poi moltiplicare il risultato per X ‘ . Ancora una volta , le grandi matrici ostano calcoli a mano , in modo da utilizzare il software statistico . Chiamare questa matrice H.

7

Sottrarre la matrice cappello dalla matrice di identità , I. La matrice identità è una matrice che ha il valore 1 per tutte le voci diagonali e 0 per tutte le voci fuori dalla diagonale . Chiamare la matrice risultante ( IH) .

8

Calcolare gli errori – punti dati stimati. Multiply ( IH ) da parte del vettore di variabili dipendenti dal set di dati . Chiamare questo vettore e. La soluzione sarà un vettore di stime errori – punti dati .

9

Aggiungere le stime degli errori – punto dati per il modello di regressione . Il modello risultante è quindi Y = XB + e.