Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Il concetto di Big Data
I Big Data hanno avuto origine nelle scienze fisiche, con la Fisica e l'Astronomia che hanno adottato presto molte delle tecniche ora applicate ai Big Data. Gli strumenti della Fisica delle Alte Energie, ma anche quelli della Bio-informatica o di altri settori scientifici costituiscono enormi raccoglitori di exabyte di informazioni, e la capacità di raccogliere tali enormi quantità di dati ha reso necessaria anche una maggiore capacità di manipolare e analizzare questi dati.
Nell'ambito delle discipline economiche, sono state estratte enormi fonti di dati per consentire approfondimenti sui sistemi economici e sociali, approfondimenti che in precedenza si basavano su metodi statistici quali i sondaggi su campioni rappresentativi.
Big Data - Terminologia e caratteristiche
Nel 2001 Doug Laney pubblica un report nel quale definisce i Big Data con il modello che sarà in seguito definito come "Il modello delle 3 V": volume,
velocità e varietà. La definizione di Laney è considerata seminale in quanto ha costituito la base per tutte le successive proposte di definizione. Nell'accezione originale di Laney, i Big Data sono dunque dati eterogenei per fonte e formato (varietà), caratterizzati da elevati volumi e da elevata velocità di generazione e acquisizione.
- VOLUME - Descrive la dimensione dell'insieme di dati di un sistema di Big Data e si riferisce all'enorme quantità di dati disponibili per l'analisi.
- VELOCITÀ - Si riferisce alla velocità - praticamente in tempo reale - con cui i dati vengono generati o elaborati. Nuove informazioni vengono aggiunte al database a velocità che possono raggiungere anche il ritmo di migliaia di elementi al secondo.
- VARIETÀ - Si riferisce alla complessità dei formati possibili per i Big Data. Oltre ai database strutturati, si tratta di grandi flussi di documenti non strutturati,
- La variabilità si riferisce alla corretta comprensione e interpretazione dei significati dei dati grezzi a seconda del loro contesto.
- La veridicità si riferisce all'affidabilità dei dati, comprendendo la riservatezza, l'integrità e la disponibilità dei dati. Deve essere garantito che i dati e le analisi eseguite sui dati siano corretti.
- La visualizzazione gioca un ruolo fondamentale. Si riferisce alla rappresentazione di una grande quantità di dati complessi in un modo molto efficace e significativo, utilizzando grafici anziché lunghi fogli di calcolo Excel.
‐ forniscano un valore di pari rilevanza se elaborati correttamente. Il valore è il valore potenziale dei dati rispetto alle informazioni che contengono. Enormi quantità di dati sono inutili a meno che non forniscano valore.
BIG DATA – FONTI E TIPOLOGIE
Esistono tipi diversi di sorgenti di Big Data, ad esempio: Dati generati nei social media, Dati personali (es. Dati da dispositivi di localizzazione), Dati generati da sensori, Dati di transazioni finanziarie, Dati amministrativi, Le principali applicazioni che costituiscono fonti di produzione di voluminose quantità di dati sono: Internet of Things (IoT), Dati auto‐quantificati, Multimedia e social media.
BIG DATA – FONTI E TIPOLOGIE – IoT
I dati Internet of Things (IoT) sono generati da dispositivi GPS, auto “smart”, dispositivi di mobile computing, tablet, telefoni cellulari, allarmi, tapparelle, sensori di finestre, apparecchi di illuminazione e riscaldamento, frigoriferi, unità a microonde,
lavatrici e così via. Questi dati hanno caratteristiche diverse rispetto ai big data in quanto i dati IoT non mostrano eterogeneità, varietà e ridondanza. HP ha previsto che, sebbene le attuali quantità di dati IoT siano ridotte, entro la fine del 2030 il numero di sensori raggiungerà 1 trilione; in quel momento, i dati IoT diventeranno big data.
BIG DATA – FONTI E TIPOLOGIE – AUTOQUALIFICAZIONE
I dati di auto-quantificazione sono generati dal singolo individuo che quantifica il proprio comportamento personale. I dati dei braccialetti utilizzati per monitorare i movimenti e l'esercizio e i manometri utilizzati per misurare la pressione sanguigna sono esempi di dati di auto-quantificazione.
BIG DATA – FONTI E TIPOLOGIE – MULTIMEDIA E SOCIAL MEDIA DATA
I dati multimediali sono generati da varie fonti, come testo, immagini e oggetti audio, video e grafici. Il tasso di crescita di questo tipo di dati è molto veloce.
Ogni individuo connesso a Internet, infatti, può generare dati multimediali. I social media data sono generati dai social media e costituiscono una categoria di dati particolarmente complessa quanto a velocità di produzione, varietà e scarsa strutturazione.
DATA ANALYTICS
BIG ANALYTICS: ESTRARRE VALORE AI BIG DATA
Il fenomeno dei Big Data è considerato potenzialmente strategico per il processo decisionale. La realizzazione effettiva del potenziale dei Big Data si basa sulla capacità di estrarre valore da enormi quantità di dati attraverso l'analisi dei dati.
Big Data Analytics è il processo per l'estrazione sistematica di informazioni dai big data. Big Data Analytics si basa su metodologie di apprendimento automatico che consentono di "apprendere" dai dati e fornire informazioni e previsioni basate appunto sui dati.
Il valore potenziale dei Big Data viene sbloccato solo quando viene sfruttato per guidare il processo decisionale.
basato sull'evidenza (evidence-based decision making). L'obiettivo è trasformare elevati volumi di dati - in rapido movimento e diversificati - in informazioni significative. L'estrazione di significato dai Big Data richiede elevata potenza di calcolo abbinata ad algoritmi deduttivi (cognitive computing) basati su Intelligenza Artificiale. Il processo complessivo di estrazione di significato dai big data può essere suddiviso in due fasi: data management e analytics. La fase data management coinvolge processi e tecnologie di supporto per acquisire e archiviare i dati e per prepararli per l'analisi. La fase analytics si riferisce a tecniche utilizzate per analizzare e acquisire intelligence dai big data. Si applica a dati testuali (text analytics), dati audio (audio analytics) e dati video (video analytics). DATA MINING - DATA ANALYTICS Data mining - Il termine data mining risale agli anni '80. L'obiettivo del data mining èestrarre conoscenza dai dati. Il termine data analytics è apparso per la prima volta all'inizio degli anni 2000 e indica l'applicazione dei sistemi informatici all'analisi di grandi insiemi di dati a supporto delle decisioni. Data analytics è un campo interdisciplinare che adotta aspetti di altri ambiti disciplinari quali statistica, apprendimento automatico, riconoscimento di modelli, teoria dei sistemi, ricerca operativa e intelligenza artificiale. BIG SOCIAL DATA (O SOCIAL BIG DATA) Le Social Network (SN) sono i principali fornitori di Big Data in quanto generano continuamente un'enorme quantità di dati eterogenei a partire dai comportamenti degli utenti. Tra le diverse tipologie di Big Data, quelli relativi alle social network sono particolarmente impegnativi a causa della grande quantità di dati eterogenei prodotti (es. multimedia, testo e audio) e della velocità con cui vengono generati. Secondo Ianni et alt (2021) le Social Network(SN) corrispondono perfettamente alla definizione di Big Data- Volume: Ci sono 4 miliardi di utenti SN attivi.
- Velocità: Ogni giorno vengono pubblicati 5 miliardi di contenuti.
- Varietà: I post contengono testi, immagini, video.
- Variabilità: I contenuti dei post sono piuttosto eterogenei.
- Verità: I contenuti devono essere verificati in quanto provengono principalmente da fonti non verificate.
- Valore: Il valore di mercato è di 20 miliardi di dollari all'anno spesi principalmente per la pubblicità sui social media.
Social media analytics si riferisce all'analisi di dati strutturati e non strutturati generati dai canali dei social media.
Social media analytics è un campo di ricerca emerso dopo l'avvento del Web 2.0 nei primi anni 2000. Il marketing è stata l'applicazione principale di Social media analytics negli ultimi anni, stante l'adozione diffusa e crescente dei social media da parte dei
consumatori di tutto il mondo. Le due fonti di informazione nei social media sono: i contenuti generati dagli utenti (ad es. sentimenti, immagini, video e segnalibri); le relazioni e le interazioni tra le entità della rete (ad es. persone, organizzazioni e prodotti).
SOCIAL MEDIA ANALYTICS – CONTENT-BASED ANALYTICS
Content‐based analytics (Analisi basata sui contenuti) Si concentra sui dati pubblicati dagli utenti sulle piattaforme di social media, come feedback dei clienti, recensioni di prodotti, immagini e video. Tali contenuti sui social media sono spesso voluminosi, non strutturati, rumorosi e dinamici. L'analisi di testo, audio e video, come discusso in precedenza, può essere applicata per ricavare informazioni da tali dati.
SOCIAL MEDIA ANALYTICS – SOCIAL NETWORK ANALYTICS
Social network analytics, questo tipo di analisi si occupa di sintetizzare gli attributi strutturali di un social network e di estrarre intelligence dalle relazioni tra le entità partecipanti.
La struttura di una social network è modellata attraverso un insieme di nodi e linee, che rappresentano rispettivamente i partecipanti e le relazioni. Il modello può essere visualizzato come un grafico composto dai nodi e da linee.SOCIAL MEDIA ANALYTICS – SOCIAL NETWORK ANALYTICS / GRAFICI
Due tipi di grafici di rete: grafici sociali e grafici di attività:
Nei grafici sociali, una linea tra una coppia di nodi significa solo l'esistenza di un legame (ad esempio, amicizia) tra le entità corrispondenti. Tali grafici possono essere estratti per identificare comunità o determinare utenti con un numero relativamente elevato di collegamenti sociali diretti e indiretti.
Nei grafici di attività le linee rappresentano le interazioni effettive tra qualsiasi coppia di nodi. Le interazioni implicano scambi di informazioni (ad es. Mi piace e commenti). I grafici delle attività sono preferibili ai grafici sociali, perché ai fini
Dell'analisi una relazione attiva è più rilevante di una semplice connessione.
PIATTAFORME DIGITALI M.3 L.13
GENERALITA' SULLE PIATTAFORME DIGITALI
LA SO