|
|
Come risolvere normalità in regressione multipla con serie temporali di dati1 Rimuovi valori anomali. Spesso i dati stessi non conformi alla normalità , ma trame e le prove che analizzano per la normalità non riescono semplicemente a causa della presenza di valori anomali nei dati . Tracciare i tuoi dati di serie temporali , alla ricerca di valori anomali ( tutti i punti che si discostano notevolmente da i principali modelli presenti nei dati) . Prendete questi valori anomali di dati e rieseguire la regressione multipla . Se l'assunzione di normalità tiene , allora il problema è risolto e si può semplicemente indicare nella vostra analisi dei dati che avevi rimosso valori anomali prima analisi dei dati. Se l'ipotesi di normalità ancora non detiene , dopo la rimozione dei valori anomali , passare ad altre tecniche. trasformazioni di dati di test . In molti casi , trasformando la variabile dipendente nei dati porta ad una distribuzione di normalità . Tre funzioni comuni in grado di trasformare i dati in un modo che lascia i dati ancora facilmente interpretabili sono la funzione di registrazione , la funzione radice quadrata e la funzione inversa . Provate ad applicare queste funzioni per la variabile dipendente , uno alla volta , e controllando la normalità . È del tutto possibile che una tale trasformazione vi lascerà con un dataset normale, che è possibile utilizzare nella vostra analisi dei dati direttamente , limitandosi ad affermare che è stata eseguita una trasformazione prima dell'analisi . aumentare la dimensione del campione . E 'noto che l'assunzione di normalità è particolarmente importante e facilmente violati in set di dati che contengono pochi punti dati . Evitare questo problema da più punti di campionamento . Per dati di serie temporali , questo significa serrando gli spazi tra le misurazioni . Se i vostri dati sono arrivati da un record di un fenomeno , è facile ri- campionare i dati , ottenendo un nuovo insieme di dati che potrebbe essere normale . Anche se i dati rompe ancora l'ipotesi di normalità , il fatto che si dispone di un ampio dataset rende questa ipotesi meno importante , a causa delle implicazioni del teorema del limite centrale . Dottorati di ricerca
|
|
Copyright © https://www.educazione.win - Tutti i diritti riservati |