In molte tecniche statistiche , l’assunzione di normalità degli errori è una delle basi di esecuzione di test di ipotesi statistiche . Pertanto , è importante per un ricercatore per controllare i suoi dati per la normalità; se l’ipotesi di normalità non riesce, questo implica che alcuni metodi statistici saranno infondata se usato su dataset del ricercatore . Questo fatto vale per la regressione multipla sui dati di serie temporali . Dati di serie temporali – dati che misurano un particolare fenomeno e portato in momenti specifici – può essere sensibile alla assunzione di normalità , come errori di misura potrebbero cambiare con il tempo. Esecuzione di regressione multipla su tali dati complica ulteriormente le cose , a causa dell’elevato livello di dimensionalità comporta . Tuttavia, un buon statistico dovrebbe comunque fare un tentativo per correggere eventuali deviazioni dal presupposto di normalità nei dati . Istruzioni

1

Rimuovi valori anomali. Spesso i dati stessi non conformi alla normalità , ma trame e le prove che analizzano per la normalità non riescono semplicemente a causa della presenza di valori anomali nei dati . Tracciare i tuoi dati di serie temporali , alla ricerca di valori anomali ( tutti i punti che si discostano notevolmente da i principali modelli presenti nei dati) . Prendete questi valori anomali di dati e rieseguire la regressione multipla . Se l’assunzione di normalità tiene , allora il problema è risolto e si può semplicemente indicare nella vostra analisi dei dati che avevi rimosso valori anomali prima analisi dei dati. Se l’ipotesi di normalità ancora non detiene , dopo la rimozione dei valori anomali , passare ad altre tecniche.

2

trasformazioni di dati di test . In molti casi , trasformando la variabile dipendente nei dati porta ad una distribuzione di normalità . Tre funzioni comuni in grado di trasformare i dati in un modo che lascia i dati ancora facilmente interpretabili sono la funzione di registrazione , la funzione radice quadrata e la funzione inversa . Provate ad applicare queste funzioni per la variabile dipendente , uno alla volta , e controllando la normalità . È del tutto possibile che una tale trasformazione vi lascerà con un dataset normale, che è possibile utilizzare nella vostra analisi dei dati direttamente , limitandosi ad affermare che è stata eseguita una trasformazione prima dell’analisi .

3

aumentare la dimensione del campione . E ‘noto che l’assunzione di normalità è particolarmente importante e facilmente violati in set di dati che contengono pochi punti dati . Evitare questo problema da più punti di campionamento . Per dati di serie temporali , questo significa serrando gli spazi tra le misurazioni . Se i vostri dati sono arrivati ​​da un record di un fenomeno , è facile ri- campionare i dati , ottenendo un nuovo insieme di dati che potrebbe essere normale . Anche se i dati rompe ancora l’ipotesi di normalità , il fatto che si dispone di un ampio dataset rende questa ipotesi meno importante , a causa delle implicazioni del teorema del limite centrale .