Data warehouse, cosa sono
Lo sviluppo dei sistemi informativi e del web ha creato un vasto patrimonio di dati. L’utilizzo di tale patrimonio informativo dell’impresa avviene tramite le tecnologie di Data Warehouse.
Il Data Warehouse (DWH) è una base di dati che mantiene tutte le informazioni sulle attività dell’azienda e che viene utilizzata dal management per prendere decisioni strategiche.
È un sistema che consente di integrare i dati dell’organizzazione, normalmente dislocati su fonti informative diverse, in un unico magazzino dati, ben organizzato lungo le sue dimensioni per essere fruibile facilmente da utenti posti a diversi livelli della gerarchia decisionale dell’azienda.
Da questo punto di vista un DWH realizza un “processo di creazione della conoscenza”: partendo dai dati dispersi dell’organizzazione (presenti sia nell’ambiente operazionale che in fonti dati esterne), attraverso una serie di passi e con l’adozione di opportuni strumenti di trattamento e trasformazione dei dati, si ottengono informazioni utili per l’utente che vengono strutturate in modo tale da essere pronte per la consultazione e che rappresentano, quindi, una base di conoscenza aziendale.
Data warehouse, quale utilizzo in azienda?
Gli obiettivi fondamentali del data warehouse sono:
- rendere le informazioni di un’azienda facilmente accessibili: il contenuto del data warehouse deve esser comprensibile, intuitivo e ovvio per l’utente aziendale, non solo per lo sviluppatore. Il contenuto deve essere etichettato in modo significativo così che gli utenti che desiderino separare e combinare i dati in combinazioni quasi infinite, abbiano tempi di attesa minimi;
- presentare le informazioni dell’azienda in modo coerente: i dati devono essere assemblati con cura da un’ampia gamma di fonti attorno all’azienda devono essere puliti la loro qualità deve esser garantita e devono essere distribuiti solo quando sono adatti al consumo da parte dell’utente;
- essere adattabili ed elastici alle modifiche, alle necessità degli utenti, alle condizioni aziendali: i dati e la tecnologia sono tutti soggetti a cambiamenti nel tempo. Il data warehouse deve essere progettato in modo da gestire questi cambiamenti inevitabili;
- essere un bastione sicuro per proteggere le informazioni: il data warehouse deve controllare efficacemente l’accesso alle informazioni riservate dell’azienda;
- servire come base per prendere decisioni migliori: esiste un solo vero output di un data warehouse, ovvero le decisioni prese dopo che il data warehouse ha presentato le sue prove;
- condividere e far accettare il data warehouse dalla comunità aziendale. A differenza della riscrittura di un sistema operazionale, in cui gli utenti aziendali non hanno altra scelta se non utilizzare il nuovo sistema, l’utilizzo del data warehouse può essere facoltativo. L’accettazione degli utenti aziendali è basata più sulla semplicità che su qualsiasi altra cosa.
Architettura e progettazione di un Data warehouse
Il ciclo di vita del data warehouse inizia con la pianificazione del progetto. In questa fase si valuta il grado di prontezza dell’azienda a un’iniziativa di data warehouse, si stabilisce un obiettivo primario e una giustificazione, si ottengono le risorse e si dà il via al progetto.
La seconda operazione principale si concentra sulla definizione delle esigenze aziendali. L’allineamento del warehouse alle necessità aziendali è assolutamente imprescindibile. Le tecnologie più avanzate non serviranno a recuperare un data warehouse che non si concentri sull’azienda. I progettisti di un data warehouse devono comprendere i bisogni dell’azienda e tradurli in considerazioni sul design.
Il design dell’architettura tecnica stabilisce la struttura generale a supporto dell’integrazione di tecnologie multiple. Utilizzando le funzionalità individuate nel design dell’architettura come una lista della spesa, si procede poi con la valutazione e la selezione di prodotti specifici.
La parte centrale del ciclo di vita si concentra sui dati. Si inizia traducendo le esigenze in un modello dimensionale, che viene poi trasformato in una struttura fisica. Ci si concentra sulle strategie di messa a punto delle prestazioni, quali l’aggregazione, l’indicizzazione e la suddivisione, durante le attività di design fisico. Come ultimo passaggio, ma ugualmente importante, si progettano e sviluppano i processi di estrazione-trasformazione-caricamento (ETL) dello staging dei dati.
Il gruppo finale di operazioni generate dalla definizione delle necessità aziendali è costituito dal design e dallo sviluppo di applicazioni analitiche. Il progetto di data warehouse non termina quando si producono i dati. La tecnologia, i dati e le tracce delle applicazioni analitiche vengono riuniti insieme a una buona dose di formazione e supporto per una distribuzione ben organizzata. Dopodiché sarà necessaria una manutenzione continua, al fine di garantire che il data warehouse risponda a tutte le necessità che il tempo e una maggiore conoscenza dei dati possano dare. Infine, si gestisce la futura crescita del data warehouse dando il via a progetti consecutivi, ciascuno dei quali torna all’inizio del ciclo vitale.
Differenze tra data warehouse e database
La principale differenza tra un database operazionale e un data warehouse è data dalla tipologia di interrogazioni. Nei database le interrogazioni eseguono transazioni che in genere leggono e scrivono un ridotto numero di record da diverse tabelle legate da semplici relazioni. Questo tipo di elaborazioni viene comunemente detto On-Line Transactional Processing (OLTP). Al contrario, il tipo di elaborazioni per cui nascono i data warehouse viene detto On-Line Analitycal Processing (OLAP) ed è caratterizzato da un’analisi dinamica e multidimensionale che richiede la scansione di un’enorme quantità di record per calcolare un insieme di dati numerici di sintesi che quantificano le prestazioni dell’azienda.
Le peculiari caratteristiche delle interrogazioni OLAP fanno sì che i dati nel data warehouse siano normalmente rappresentati in forma multidimensionale. L’idea di base è quella di vedere i dati come punti in uno spazio le cui dimensioni corrispondano ad altrettante possibili dimensioni di analisi là dove ciascun punto, rappresentativo di un evento accaduto nell’azienda, viene descritto tramite un insieme di misure di interesse per il processo decisionale.
Quali sono i vantaggi che le aziende e la pubblica amministrazione possono ottenere utilizzando i data warehouse?
Le aziende devono essere “agili” e veloci nel rispondere ai cambiamenti in un ambiente di business in continua evoluzione, così da poter aumentare il proprio vantaggio competitivo. Per essere vincenti nel mercato le aziende hanno bisogno delle informazioni che le mettano in condizione di conoscere i fatti, della capacità di prendere decisioni velocemente e dell’esperienza per agire senza problemi. Migliorando l’agilità aziendale attraverso l’adozione di un solido data warehouse, le imprese ottengono tre benefici specifici:
- una visione migliore;
- una maggiore efficienza in situazioni complesse;
- l’opportunità di essere innovative.
L’abilità di una azienda di percepire i cambiamenti e rispondervi in modo efficace ed efficiente rende la propria azienda agile. Tutti gli investimenti e tutti i processi di business adottati devono contribuire a migliorare l’agilità aziendale. Il più alto grado di agilità aziendale si raggiunge con la conoscenza, la visibilità e le soluzioni che mettono in grado un’impresa di processare più velocemente i dati in suo possesso così da rispondere efficacemente – producendo profitto – ai cambiamenti inaspettati. Le aziende, quindi, diventano capaci di gestire e superare una sempre crescente complessità anticipando la conoscenza dei trend di mercato, di generare profitti e di perseguire nuove opportunità, tutto questo mentre i propri competitor stanno ancora cercando di capire cosa stia succedendo.
Come aiuta Consulthink le aziende che desiderano implementare soluzioni di data warehouse?
Consulthink è in grado di supportare i propri clienti in tutte le fasi di progetto del data warehouse, grazie al suo team altamente specializzato in progetti di Data warehouse e Business Intelligence. Esperienza maturata sul campo, lavorando per grandi clienti, pubblici e privati. I nostri professionisti sono al vostro servizio, proponendovi il modello di data warehouse che meglio possa rispondere alle esigenze della vostra azienda ed offrendovi nel tempo un servizio di manutenzione che possa analizzare sempre meglio i dati permettendovi di rispondere prontamente e meglio dei vostri competitor, ai trend del mercato, consentendovi di beneficiare di nuove opportunità.
Redatto da Lucia D’Adamo, in collaborazione con Marta Salazar, supervisionato da Marco Pirrone