Nonostante il vecchio adagio di ” bugie, le maledette bugie e le statistiche “, metodi statistici sono di vitale importanza per l’analisi dei dati quantitativi. Tecniche statistiche aiutano a sintetizzare e dare un senso a ciò che altrimenti potrebbe apparire come un enorme numero di numeri confusione e codici .

L’analisi di solito inizia con statistiche descrittive , che presentano una sintesi dei dati . Nell’analisi dei dati principali , i ricercatori impiegano statistica inferenziale per costruire modelli che permettano loro di andare al di là dei dati e rendere dichiarazioni circa la popolazione più ampia . Uni -variata Statistica descrittiva

Le statistiche descrittive più utili per le variabili singole (statistiche uni -variata ) presentare la sua distribuzione e le misure di tendenza centrale e dispersione . La distribuzione è la frequenza con cui ciascun valore appare nel set , e può essere espressa sia elencando quante volte un valore visualizzato ( ad esempio quante persone nel set di dati sono stati invecchiati 18 , 19 , 20 , 21 ecc ) o raggruppando i valori in categorie ( quante persone erano sotto di 25 , 25-34 , 35-44 , ecc.) Le misure di tendenza centrale sono la media ( media ) , la mediana ( il valore centrale che divide i dati impostati esattamente a metà) , e la modalità ( il valore più comune ) . Le misure di dispersione comprendono la gamma ( massimo meno il valore più basso ) , la deviazione standard e varianza ( entrambi sono misure di scostamento medio dalla media ) .

Correlazioni

la correlazione è una misura descrittiva di associazione , che mostra come correlata due variabili . I coefficienti di correlazione variano da -1 a +1, dove -1 e +1 significa che le due variabili sono perfettamente correlate , cioè se si conosce il valore di quello che si può calcolare il valore degli altri , senza un errore . Una correlazione negativa significa che per valori elevati di una variabile , i valori delle altre variabili sono inferiori; una correlazione positiva significa che i valori più elevati di una variabile corrispondono a valori più alti degli altri . Coefficiente di correlazione 0 significa nessuna relazione tra le variabili .

Stima Errore

Anche se le statistiche descrittive forniscono un quadro riassuntivo dei dati , la maggior parte dei progetti di ricerca non lo fa raccogliere dati da tutta la popolazione che interessa i ricercatori . Tecniche statistiche vengono quindi utilizzati per calcolare l’errore di misurazione e per stimare i valori possibili della variabile in tutta la popolazione

Statistica inferenziale : . Prova la differenza

One le operazioni più comuni di qualsiasi analisi dei dati è quello di testare una differenza tra due o più misurazioni , sia tra gruppi o per lo stesso gruppo misurata in diversi punti di tempo . Test qui significa stabilire se la differenza osservata è puramente dovuto al caso o se è probabile che riflettano le differenze reali nella popolazione . Differenze statisticamente significative differenze significa che è improbabile che sia causato per puro caso ( per inciso , i termini ” statisticamente significativo ” non dice nulla circa le dimensioni o l’importanza della differenza) .

Le tecniche specifiche e adeguate per testare le differenze variano a seconda del tipo di dati . Differenze tra mezzi sono testati da t-test o ( in situazioni più complesse ) varie versioni di analisi della varianza e covarianza ( ANOVA , ANCOVA , MANOVA ) . Se non è possibile calcolare mezzi per la variabile — la variabile non è misurato su una scala di intervallo , per esempio il sesso , religione, nazionalità — test non parametrici sono adatti .

Statistica inferenziale : i modelli di associazione

Spesso , i ricercatori vogliono andare oltre la verifica delle differenze tra i gruppi e vogliono determinare le precise relazioni tra variabili . La misura più semplice di tale associazione è correlazione , ma è possibile costruire e testare statisticamente modelli più complessi che possono separare e individualmente quantificare l’influenza di diverse variabili . Analisi di regressione lineare multipla è la tecnica più comune e molto potente modellazione statistica , spesso in combinazione con analisi della varianza a tentativi di costruire modelli causali . Esistono anche altri modelli di regressione , compresi i modelli non lineari e non parametrici

Statistica inferenziale : . Classificazione

Tra le molte altre tecniche di analisi statistica , un importante gruppo comprende tecniche statistiche che possono essere utilizzati per classificare e categorizzare le variabili e soggetti. Queste tecniche di classificazione includono l’analisi fattoriale e l’analisi delle corrispondenze , per classificare le variabili in dimensioni a livello di meta; nonché vari metodi per la classificazione soggetti ( casi) , compresa l’analisi dei cluster e alberi di classificazione .