Come utilizzare Analisi Discriminante

analisi discriminante è un metodo di classificazione che utilizza misure statistiche come covarianza e misure geometriche come distanza euclidea per determinare quale gruppo un punto di dati sconosciuti appartiene . Usando l'analisi discriminante prevede due fasi principali : trovare i coefficienti discriminanti da un insieme ben compreso dei dati e applicando i coefficienti di dati sconosciuti per produrre classifications.Things gruppo che ti serviranno
Software di statistica ( R , SPSS , SAS o S + )

Mostra Altre istruzioni
1

decidere sulle variabili che si desidera includere nello studio. Queste variabili dovrebbero essere le caratteristiche che si ritiene aiuterà classificare punti dati in specifici gruppi mutuamente esclusivi . Ad esempio, se i gruppi sono ad essere "uomini e donne", le possibili variabili includono il numero di figli , anni di scolarizzazione e di reddito annuo .
2

raccogliere una serie di dati che possono essere classificati in mutuamente gruppi esclusivi (ad esempio , uomini e donne , compratori e venditori , o cinesi e taiwanesi ). Raccogliere i dati sulle variabili che avete precedentemente decise per ogni punto dati .
3

Calcolare i centroidi per ogni gruppo . Il calcolo dei centroidi dipende dal numero di variabili che si è scelto di includere nell'analisi . Ad esempio , se avete deciso di indagare solo due variabili , allora esisteranno le vostre centroidi in euclideo 2 -spazio.
4

Calcolare la distanza tra i due baricentri , e denotano questa distanza come un vettore , "D ". Il vettore sarà come molte dimensioni del numero di variabili di interesse . Nel caso in cui si sta indagando due variabili , i vettori , "d ", sarà bidimensionale .
5

Calcolare la somma all'interno del gruppo delle piazze matrici per ciascun gruppo . Chiamare queste matrici " W1 " e " W2 ".
6

Pool la somma all'interno del gruppo di matrici quadrate di produrre una matrice all'interno del gruppo covarianza . Chiamare questa matrice " Cw ".
7

calcolare l'inverso di " Cw ". Chiamare questa matrice inversa " Cw - 1 ".
8

Multiply " Cw - 1" e " d ". Chiama questo vettore " Cw - 1d . " La sua dimensione deve essere uguale al numero di variabili è stato incluso nell'analisi .
9

Calcolare i coefficienti della funzione discriminante . Questi coefficienti sono proporzionali a " Cw - 1d ".
10

Raccogliere dati di interesse ( dati che si desidera classificare in gruppi ) . Per applicare correttamente l'analisi discriminante , solo raccogliere dati sulle variabili di interesse ; conoscendo le classifiche sconfigge in anticipo allo scopo di effettuare analisi discriminante .
11

Scrivi ogni punto di dati come un vettore . Le dimensioni dei vettori sono uguali alle dimensioni del set di dati originale .
12

classificare ciascun punto di dati . Moltiplicare ogni punto dati per i coefficienti della funzione discriminante . L'output vi darà la classificazione del punto dati . Ad esempio , se si utilizza anni di scolarizzazione e reddito annuale come variabili per predire il genere dei punti di dati , il numero risultante sarà o essere più vicino al "maschio " o " femmina". Il gruppo il punto è più vicino è il gruppo è classificato come .