Cluster analysis e analisi fattoriale sono due metodi statistici di analisi dei dati . Queste due forme di analisi sono molto utilizzati nel campo delle scienze naturali e comportamento . Sia l’analisi dei cluster e analisi fattoriale consentono all’utente di raggruppare parti i dati in “cluster” o su “fattori “, a seconda del tipo di analisi . Alcuni ricercatori nuovi ai metodi di analisi di cluster e fattori possono ritenere che questi due tipi di analisi sono simili complessiva . Mentre l’analisi cluster e analisi dei fattori sembrano simili in superficie, essi differiscono in molti modi, anche nei loro obiettivi e le applicazioni generali .

Analisi cluster Obiettivo e analisi fattoriale hanno obiettivi diversi . L’obiettivo abituale di analisi fattoriale è spiegare correlazione in un insieme di dati e variabili in relazione tra loro , mentre l’obiettivo di analisi dei cluster è affrontare eterogeneità in ogni set di dati . In spirito , la cluster analysis è una forma di categorizzazione , considerando che l’analisi fattoriale è una forma di semplificazione .

Complessità

complessità è una questione su cui l’analisi fattoriale e cluster analysis differiscono : dimensione dei dati colpisce ogni analisi in modo diverso . Come l’insieme di dati cresce , cluster analysis diventa computazionalmente intrattabile . Questo è vero perché il numero di punti di dati in cluster analysis è direttamente correlato al numero di possibili soluzioni cluster . Ad esempio , il numero di modi per dividere venti oggetti in 4 gruppi di uguale dimensione supera 488 milioni . Questo rende metodi computazionali diretti , compresa la categoria dei metodi a cui appartiene l’analisi fattoriale , impossibile.

Soluzione

Anche se le soluzioni sia per l’analisi fattoriale e problemi di analisi di cluster sono personale in una certa misura , l’analisi fattoriale permette un ricercatore fino ad ottenere una soluzione “migliore ” , nel senso che il ricercatore può ottimizzare un certo aspetto della soluzione ( ortogonalità , facilità di interpretazione e così via ) . Questo non è così per l’analisi di cluster , poiché tutti gli algoritmi che potrebbe produrre una soluzione migliore analisi dei cluster sono computazionalmente inefficiente . Quindi , i ricercatori impiegano cluster analysis non possono garantire una soluzione ottimale .

Applicazioni

analisi fattoriale e cluster analysis differiscono nel modo in cui vengono applicati ai dati reali . Poiché l’analisi fattoriale ha la capacità di ridurre un insieme di variabili ingombrante per un set più piccolo di fattori , è adatto per semplificare modelli complessi . L’analisi fattoriale ha anche un uso di conferma , in cui il ricercatore può sviluppare una serie di ipotesi per quanto riguarda come variabili nei dati sono correlati . Il ricercatore può quindi eseguire l’analisi fattoriale sui dati impostati per confermare o smentire queste ipotesi . Analisi dei cluster , d’altra parte , è adatto per classificare oggetti secondo determinati criteri . Ad esempio , un ricercatore può misurare alcuni aspetti di un gruppo di piante scoperte di recente e porre queste piante in categorie di specie utilizzando cluster analysis .