I dati aggregati sono informazioni che vengono raccolte da diverse fonti . Esso fornisce informazioni sintetiche sulle caratteristiche del database nel suo complesso , ma non guarda variazioni individuali . Un buon esempio potrebbe essere statistiche sanitarie provenienti da diverse contee all’interno di uno stato . I dati aggregati possono mostrare tendenze da contea a contea , ma non necessariamente tra i soggetti all’interno di ogni contea. Fallacia ecologica

Un limite fondamentale di dati aggregati si riferisce a come la fallacia ecologica . I ricercatori possono utilizzare dati aggregati per trovare caratteristiche medie per un gruppo , ma non possono presumere che tali caratteristiche medie si riferiscono a ogni membro del gruppo. Poiché i dati aggregati in genere non consentono una facile manipolazione di variabili , ci può essere una tendenza a trascurare le influenze che possono influenzare gli individui all’interno del set di dati . Gli utenti dei dati devono ricordare che i dati aggregati mostra solo le medie , non i singoli attributi. Dati

sopravvivenza dati

di sopravvivenza , o dati time-to – evento , è un componente importante di molti studi relativi alla salute che guardano effetti a lungo termine delle variabili ai singoli . In questo tipo di studio, i ricercatori guardano soggetti più di una volta per un periodo di tempo prolungato . Questo di solito è facile da fare con i dati dei singoli pazienti , ma spesso impossibile con i dati aggregati poiché non ci può essere alcun modo di identificare i soggetti individuali di studio . I ricercatori possono fare grandi generalizzazioni circa del campione , ma non possono tornare a singoli soggetti in seguito. Poiché i dati aggregati si riferiscono solo a una specifica istanza per ogni soggetto , la sua utilità per la ricerca che ha un tempo di ritardo è limitato.

Singole variabili

Un importante limitazione dei dati aggregati è che i ricercatori non possono usarlo per studiare gli effetti delle variabili a livello di singolo soggetto. I ricercatori possono esaminare i grandi effetti dei rapporti prespecificati in uno studio di aggregazione , ma non sono in grado di esplorare i rapporti di altre variabili che possono diventare visibili in più database unit- based. Facendo affidamento su dati aggregati , perdono la possibilità di utilizzare i dati per generare più ipotesi .

Problematiche di controllo dei dati

Una limitazione finale dei dati aggregati ha meno a che fare con la sua utilità per la ricerca che con il suo ruolo di sostegno nelle grandi organizzazioni . Collezioni di dati finanziari e sanitari aggregati devono essere tenuti al sicuro se hanno un conto o informazioni di identificazione. Il dato è utile solo se esso è accessibile , ma l’accessibilità può portare alla vulnerabilità di hacking e furto di informazioni . I proprietari di grandi raccolte di dati aggregati accessibili deve prendere molte precauzioni per garantire la sicurezza dei dati .