Anteprima
Vedrai una selezione di 1 pagina su 2
Data werehausing e data mining Pag. 1
1 su 2
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Capitolo 8: Tecnologie a livello applicativo (pag. 145, SI_08)

Data Warehausing

Per ogni azienda è fondamentale poter disporre e accedere molto rapidamente alle informazioni che vengono estratte dalla moltitudine di dati, sia interni che esterni, contenuti nei database aziendali, ma non solo, è importante anche che le fonti di dati vengano costantemente aggiornate, che i dati siano organizzati in maniera tale da semplificare le analisi e che vengano messi in relazione soltanto quelli di interesse. Per soddisfare tutte queste esigenze nasce il concetto di Data Warehause, che possiamo vedere come un grande raccoglitore di informazioni (ovvero una base di dati) che integra e organizza dati provenienti da diverse fonti e di diversa natura e li rende disponibili col fine di poter eseguire le analisi e le valutazioni necessarie per pianificare al meglio il processo decisionale.

Il Data Warehause (DW) è un sistema di tipo OLAP, i quali permettono di realizzare operazioni

complessenelle quali vengono coinvolti molti dati aggregati e storici, ed inoltre hanno come misura di efficacia edefficienza il tempo di risposta. In tali sistemi, per rappresentare i dati si ricorre al modellomultidimensionale, nei quali l'informazione è rappresentata attraverso il concetto di ipercubo. Gli elementi che costituiscono un modello multidimensionale sono i seguenti:
  1. Fatto, è l'elemento dell'ipercubo;
  2. Dimensione, coordinate di ciascun elemento che corrispondono a dimensioni di analisi;
  3. Misura, valore quantitativo del fatto elementare.
Il Data Warehause presenta le seguenti caratteristiche:
  1. Orientato alle entità o oggetti, considera le principali entità di analisi;
  2. Integrato e consistente, i dati sono prelevati sia da fonti interne che esterne all'azienda;
  3. Variabile nel tempo, memorizza dati storici;
  4. Non volatile e persistente, i dati inseriti non vengono modificati e sono accessibili solo in lettura.
I DW atre livelli sono così formati:
  1. Sorgenti;
  2. Dati informazionali;
  3. Strumenti di Analisi;
Al livello più basso si trovano le sorgenti, ovvero il luogo da cui i dati vengono estratti. Esse vengono sottoposte ad un insieme di operazioni che vengono racchiuse sotto il nome di ETL (Extraction, Transformation e Loading) che sono:
  1. Estrazione, i dati vengono estratti dalle sorgenti secondo estrazione statica o incrementale;
  2. Pulitura, vengono corretti errori e migliorata la qualità dei dati;
  3. Trasformazione, i formati dei dati vengono resi omogenei;
  4. Caricamento, i dati vengono trasferiti nel DW seguendo il modello multidimensionale.
All'interno del Data Warehousing sono racchiuse anche delle tecniche che possono essere utilizzate per analizzare i dati. L'utente interagisce con l'ipercubo ed estrae dati di interesse. Ogni interazione consiste nell'applicazione di un operatore OLAP, tra i principali si ricordano:
  1. Drill-Down, che permette di...
  1. Per ottenere dati più dettagliati passando da un livello di aggregazione più alto ad uno più basso.
  2. Roll-Up, operazione opposta al drill-down.
Dettagli
Publisher
A.A. 2020-2021
2 pagine
1 download
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher sandra45- di informazioni apprese con la frequenza delle lezioni di Sistemi informativi aziendali e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Mecella Massimo.