Cosa sono le procedure ETL nel Data Warehousing? Iniziamo con il capire cosa significa l’acronimo ETL. Le tre lettere sono le iniziali dei tre termini in lingua inglese Extract, Transform, Load. Con questi tre termini si fa riferimento alle tre funzioni che caratterizzano le procedure ETL, vale a dire: l’estrazione, la trasformazione e il caricamento di set di dati nell’ambito di un sistema di Data Warehouse.
Extract – I set di dati vengono estratti tramite l’accesso a database più o meno strutturati o a piattaforme informatiche gestionali.
Transform – I dati estratti tramite procedure ETL vengono, poi, elaborati per essere trasformati in dati consolidati, utili alle analisi del Data Warehouse (DWH): selezioni, normalizzazioni, accoppiamenti… Mantenendo sempre la granularità dei dati.
Load – Al termine dell’operazione di trasformazione, i dati vengono caricati nei sistemi di sintesi come il DWH o i Data Mart.
La suite di Business Intelligence Pentaho prevede sistemi che svolgono procedure ETL integrate, in grado di rendere interoperabili basi di dati disomogenee, elemento fondamentale per la corretta gestione dei dati e alimentazione del DWH. Anche per questo, Pentaho è la soluzione proposta dagli esperti di Business Intelligence di Bucap.