Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
COME VIENE UTILIZZATA LA DATA SCIENCE NEI DIVERSI
SETTORI
Le banche usano la data science per profilare meglio le abitudini dei clienti e ridurre al
minimo rischi e frodi: la data science soprattutto aiuta a migliorare la trasparenza e la
verificabilità del flusso di lavoro con l’automazione, a prendere decisioni migliori ottimizzando
le performance, a creare report normativi e gestionali accurati e on-demand. L’industria
manifatturiera si serve della data science per ottimizzare la produzione, aumentando la
qualità e riducendo gli sprechi. La data science aiuta ad effettuare un’analisi avanzata che
identifica i problemi prima che si verifichino, e a raggiungere un controllo avanzato del
processo produttivo, monitorandolo in tempo reale; serve poi ad avere una visione sistemica
delle operazioni, a ridurre i costi di manutenzione e massimizzare l’efficacia delle
attrezzature e ad ottimizzare la logistica. Il retail utilizza la data science per approfondire la
relazione con il cliente e migliorare la sua customer experience: prevederne la domanda,
comprenderne il percorso d’acquisto, identificare le opportunità per migliorare le prestazioni,
ottimizzare il merchandising. Il settore sanitario può servirsi della data science per scoprire
le informazioni nascoste capaci di migliorare l’assistenza ai pazienti: analizzare i dati clinici e
determinare il trattamento ottimale, per esempio. L’analisi e la condivisione dei dati aiutano
ad evitare errori farmacologici, a studiare e identificare i pazienti a rischio, e ad ottimizzare la
pianificazione della dimissione.
SCIENZA DEI DATI VS ANALISI DEI DATI
Quando si parla di scienza dei dati e di analisi dei dati non è la stessa cosa. Esse, infatti,
differiscono essenzialmente per lo scopo: la Data Science è un termine generico per un
gruppo di campi utilizzati per estrarre insiemi di dati di grandi dimensioni; mentre l'Analisi dei
dati è una versione più focalizzata di questo e può anche essere considerata parte del
processo più ampio. Esse differiscono anche per l’esplorazione: la scienza dei dati non si
occupa di rispondere a query specifiche, ma di analizzare enormi set di dati in modi a volte
non strutturati per esporre le informazioni (si concentra su quali domande dovrebbero essere
poste); mentre l’analisi dei dati, al contrario, funziona meglio quando è focalizzata, avendo
quindi in mente domande che richiedono risposte basate su dati esistenti (enfatizza quindi la
scoperta di risposte alle domande poste). Un’altra differenza ancora più importante è il fatto
che la scienza dei dati è più preoccupata di fare domande piuttosto che trovare risposte
specifiche; mentre l’analisi dei dati si concentra sulla definizione di tendenze potenziali
basate su dati esistenti, oltre che sulla realizzazione dei modi migliori per analizzare e
modellare i dati. Ci sono, però, anche delle funzioni interconnesse tra la scienza dei dati e
l’analisi dei dati infatti: la scienza dei dati getta basi importanti e, grazie ad esse, l’analisi dei
dati analizza i data set per creare osservazioni iniziali, tendenze future e approfondimenti
potenziali che possono essere importanti.
BIG DATA ANALYTICS
Big Data Analytics è il processo di analisi di grandi e complesse fonti di dati, il cui fine è
quello di scoprire tendenze, modelli, comportamenti dei clienti e preferenze di mercato per
migliorare l'assunzione di decisioni aziendali. Con l'attuale tecnologia, è possibile analizzare
i dati e ottenere risposte quasi immediatamente, attività che sarebbe più lenta e meno
efficiente con l'utilizzo di soluzioni di business intelligence tradizionali. I Big Data Analytics
aiutano infatti le aziende a sfruttare i loro dati e ad utilizzarli per identificare nuove
opportunità di business e questo si traduce in decisioni più smart, operazioni più efficienti,
profitti più elevati e clienti più soddisfatti. I big data sono generalmente caratterizzati dalle tre
V: ● Volume: grandi quantità di dati generati ogni secondo da sorgenti eterogenee quali
sensori, log, eventi, e-mail, social media e database tradizionali.
● Varietà: molte forme diverse di dati che vengono generati, collezionati e utilizzati, non
strutturati e strutturati. Prima dell’epoca dei big data si tendeva a prendere in
considerazione per le analisi principalmente dati strutturati. Per avere analisi più
accurate e più profonde, oggi è necessario prendere in considerazione anche dati
non strutturati (file di testo generati dalle macchine industriali o i log di web server o
dei firewall eccetera) e semi strutturati (per esempio, atto notarile con frasi fisse e
frasi variabili) oltre che quelli strutturati (come la tabella di un database).
● Velocità: frequenza dei dati in arrivo. Si riferisce alla velocità con cui i nuovi dati
vengono generati e arrivino in tempo reale.
Con il tempo, sono state introdotte una quarta e quinta V:
● Veridicità: indica quindi il livello di affidabilità o inaffidabilità dei dati. Organizzare i dati
non si rivela un’operazione semplice poiché i dati posso diventare disordinati a causa
delle variabili descritte in precedenza e sono di conseguenza molto difficili da
controllare.
● Valore: si riferisce alla capacità di trasformare i dati in valore. Questa è una variabile
fondamentale perché l’importanza dei big data sta nella possibilità di essere utili per
le aziende, quindi di portare dei benefici. Per essere davvero utili devono poter
essere convertiti in informazioni preziose che permettono alle aziende di verificare ed
eventualmente modificare le sue mosse. (Per esempio: Netflix riesce a ricavare una
grande mole di informazioni dai propri utenti e il comportamento di questi influisce
sulle decisioni aziendali determinando come l’azienda si muove rispetto alla
creazione di nuovi contenuti o l’eliminazione di altri. I dati gli sono utili anche per gli
utenti stessi che in base alle loro preferenze di visione ricevono consigli su altri
contenuti che possono essere di loro interesse.)
DATA ANALYTICS…in riferimento ai Big Data Analytics
Analytics è la scienza dell’analisi dei dati che ha l’obiettivo di trarre conclusioni attraverso lo
studio delle informazioni raccolte, è un processo scientifico di scoperta e comunicazione dei
modelli significativi che possono essere trovati nei dati. In pratica, i dati grezzi, che sono tra
loro molto eterogenei, vengo trasformati in insights (intuizioni) utili per prendere decisioni
migliori. Essa si basa su un insieme di scienze, tecniche e tecnologie che vanno dalla
statistica, alla matematica, alle tecnologie di business intelligence di base, al reporting,
all’elaborazione analitica online e varie forme di analisi avanzate. Gli strumenti di analytics
vengono solitamente suddivisi in 4 macro categorie:
DESCRIPTIVE ANALYTICS
L’analisi descrittiva costituisce lo stadio preliminare della data analysis e risponde al quesito:
“che cosa è successo?”. È l’insieme di strumenti orientati a descrivere la situazione attuale e
passata dei processi aziendali e/o aree funzionali. Questi strumenti permettono di accedere
ai dati secondo viste logiche flessibili e di visualizzare in modo sintetico e grafico i principali
indicatori di prestazione.
PREDICTIVE ANALYTICS
L’analisi predittiva risponde all’interrogativo: “che cosa potrebbe succedere nel futuro?”. I
modelli di predictive analytics si fondano su dati storici per individuare le probabilità che un
certo evento si materializzi nel futuro, si tratta di strumenti caratterizzati da tecniche
matematiche quali regressione, forecasting, modelli predittivi.
PRESCRIPTIVE ANALYTICS
La prescriptive analytics è il più evoluto campo dell’analisi quantitativa dei big data, pronto a
rispondere alla domanda “cosa accadrà?” e “perché avverrà?”. L’analisi prescrittiva è un tool
che mette a disposizione delle indicazioni strategiche o delle soluzione operative basate sia
sull’analisi descrittiva sia su quella predittiva. Questa forma di analisi dei big data infatti aiuta
le aziende a mettere sul mercato i prodotti giusti nelle tempistiche puntuali, migliorando
l’esperienza complessiva del cliente.
AUTOMATED ANALYTICS
Questo tipo di analisi permette di entrare nell’ambito dell’automazione con soluzioni di
analytics. A fronte dei risultati delle analisi descrittive e predittive, le automated analytics
sono nella condizione di attivare delle azioni definite sulla base di regole che possono
essere a loro volta il frutto di un processo di analisi, come ad esempio lo studio dei
comportamenti di una determinata macchina a fronte di determinate condizioni oggetto di
analisi.
DATA VISUALIZATION e VISUAL ANALYTICS
La visualizzazione dei dati è la rappresentazione delle informazioni in grado di trasformare i
dati in valore e di poterli comunicare in modo efficace. Rende possibile alle persone
comprendere modelli, tendenza e insight mediante rappresentazione grafica fatta da diverse
forme, tra cui tabelle, grafici a torta, grafici a linee, grafici a colonna, ecc. Si tratta di un
processo sempre più centrale in Analytics tanto che spesso si arriva a parlare di Data
Design, cioè di un approccio strutturato alla creazione di report visivi e interattivi che
permettono, a chi li osserva, di interpretarli con facilità e di cogliere velocemente le
informazioni più significative. Una visualizzazione efficace, infatti, riduce significativamente il
tempo necessario al pubblico per elaborare le informazioni e accedere a preziosi
approfondimenti. L’analisi visiva è l’analisi che comporta la costruzione di diversi grafici con
gli stessi dati per dare varie prospettive e per identificare eventuali lacune, outlier, tendenze
e punti di dati interessanti che richiedono ulteriori indagini. C’è una relazione quasi
simbiotica tra data visualization e visual analytics perché una buona visualizzazione dei dati
fa sì che l’analisi visiva sia più efficace e mostri agli utenti migliori intuizioni.
DATA MARKETING
Altro passaggio necessario è contestualizzare l’Analytics al settore del marketing: è quindi
importante dare un valore commerciale e di business ai dati. Si parla infatti di Data
Marketing, facendo riferimento alle tecniche, ai processi, agli strumenti e alle tecnologie
utilizzate per processare le informazioni che servono per determinare il comportamento
dell’utente. Le soluzioni del data marketing permettono di processare e capire i big data e
favorire la pianificazione e gestione per consentire: di rilevare problemi e opportunità; di
<