business intelligence open source: Pentaho

Significato di granularità dei dati in un Data Warehouse

Significato di granularità dei dati in un Data Warehouse


Qual è il significato del termine granularità dei dati in ambito informatico?

Il termine granularità (granularity) fa riferimento a una caratteristica specifica del Data Warehouse: la possibilità di settare vari livelli di dettaglio (o di sintesi) dei dati raccolti. Livelli che possono andare dai singoli record, alle sintesi dei Datamart.

Dietro il significato e il concetto di granularità dei dati, c’è un’esigenza estremamente pratica:  l’economicità delle elaborazioni legate alle analisi. Più sintetizzati saranno i dati, meno record si dovranno elaborare e minore sarà anche lo spazio occupato in memoria dagli aggregati.

In genere, un Data Warehouse aziendale prevede un numero minimo di granularità, che risponde alle modalità di Data Harvesting e alle esigenze di analisi dell’azienda. Un primo livello, necessario in fase di raccolta dei dati, il cui dettaglio è molto elevato. Si pensi, ad esempio, alla singola vendita o a un altro dato di natura operazionale. Il secondo livello potrebbe essere rappresentato direttamente dalle aggregazioni di dati che alimentano i Datamart dipartimentali.

Comprendere il significato di granularità dei dati, tutto sommato, significa comprendere le logiche di funzionamento di un Data Warehouse e dei sistemi di Business intelligence.

Area Editoriale

AREA EDITORIALE

Una raccolta di articoli per chi vuole approfondire il mondo della gestione delle informazioni e della digitalizzazione.