DATI, INFORMAZIONE, CONOSCENZA02.
Spesso in azienda si chiede a chi ha competenze statistiche o informatiche di produrre delle
visualizzazioni eleganti dei dati aziendali che richiedono invece competenze di design o viceversa
si chiede a un designer di estrarre, analizzare in maniera strutturata delle basi dati. Tuttavia, già da
due sono competenze e anime fondamentali data
qui comprendiamo che nel mercato dei
analytics: →
DATA ANALYST raccoglie e elabora i dati
→
INFORMATION DESIGNER Visualizzazione e rappresentazione dei dati = prende i dati e li rende
comprensibili al target cui sono rivolti
↓
Queste due competenze devono lavorare assieme
Non è compito dell’information designer raccogliere ed elaborare i dati. È importante tuttavia
che ne comprenda anche lui gli indicatori e il signi cato per poterli aggregare in una
visualizzazione immediatamente e facilmente comprensibile e corretta.
Importante notare che già il 50% delle grandi organizzazioni in Italia hanno già un
data analyst.
Se guardiamo bene alle terminologie utilizzate per identi care le competenze richieste dal
3 CONCETTI FONDAMENTALI:
mercato dei data analytics, emergono
Dato →
1. data design, data visualization
Informazione →
2. information design, infogra ca, information architecture
Design o visualizzazione →
3. information design, data design o data visualization =
rappresentazione / visualizzazione di questi dati
Importante notare che il risultato della visualizzazione dei dati non sempre è un design gra co, ma
rappresentazione di dati o informazioni:
va concepito più in generale come nel nostro caso è il
risultato del design, ma può essere anche una notizia, una narrazione, indipendente dal suo
formato (immagine, testo, audio, video)
DAL DATO ALLA CONOSCENZA
Quando parliamo di dati e informazioni, intendiamo la stessa cosa? E la conoscenza come si
rapporta ai dati e alle informazioni? gerarchia
GERARCHIA IKW —> Un primo suggerimento ci arriva dal modello della
dell’information, knowledge, wisdom
= modello di origine incerta che descrive i livelli attraverso i quali i dati possono essere trasformati
in informazioni, poi in conoscenza, e in ne addirittura in saggezza. L’esigenza di de nire dei nessi
causali tra questi livelli nasce soprattutto in ambito informatico per analizzare come i dati grezzi
possano essere elaborati e interpretati per diventare progressivamente più utili e signi cativi.
→ lo scopo della information-knowledge-wisdom hierarchy è de nire i diversi livelli di
apprendimento secondo un approccio causale e gerarchico che collega dati, informazioni,
→
conoscenza e saggezza questi 3 ambiti sono legati da una reciprocità causale = la saggezza
dipende dalla conoscenza, la conoscenza dipende dall’informazione
→ è una gerarchia che viene studiata in vari ambiti disciplinari (scienze dell’informazione, loso a
e scienze cognitive) x dare un signi cato a questi concetti e tradurre qual’è il processo cognitivo
attraverso cui arriviamo alla conoscenza da un fenomeno analizzato.
1934
Una prima rappresentazione del concetto ce l’abbiamo nel 1934 dal poeta T.S Eliot che scrive
Rock” “Where is the Life we have lost in living? Where is the wisdom we
l’opera “The in cui dice:
have lost in knowledge? Where is the knowledge we have lost in information” 1
fi fi fi fi fi fi fi fi fi fi fi
→ citazione che appare spesso in vari studi sulle gerarchie IKW (Negli anni '30 si stava
sviluppando il relativismo scienti co e culturale)
→ Per Eliot la sequenza è logica: la saggezza si è confusa con la conoscenza e la conoscenza
con le informazioni: per Eliot è una critica culturale e spirituale dell'epoca moderna in uenzata
dalla scienza o dalla tecnologia emergente del suo tempo.
Eliot studiava a Harvard con il losofo e fondatore della cibernetica (= intelligenza arti ciale degli
Norbert Wiener
anni ’60) -> scrive l’articolo “Relativismo” in cui c’è una delle sue prime intuizioni
↓
intellettuali)
se prima facevo delle scelte in base alla collettività, alle appartenenze culturali ecc, nel 21
secolo tutto diventa soggettivo, non ci sono più verità oggettive (solo soggettive)
↓
Eliot concorda sulla natura relativa e contestuale di ogni verità.
↓
dice che informazioni e dati non sono veri, ma sono solo “i più soddisfacenti che conosciamo”
↓
il dato, che noi diamo sempre x veritiero e assoluto, è di per se una misurazione —> il
fenomeno tradotto in unità di misura —> quindi non è mai vero, è il più soddisfacente che
conosciamo -> ci a diamo ai dati perché sono quelli più “veridici” (no veri)
—> Tutto nasce dal fatto che niente è certo / vero
1940-50
il dato arriverà più tardi dell’informazione nel 1982, tuttavia
↓
Nel 1948 c’è un genio di nome Claude Shannon che è il fondatore delle scienze dell’informazione
dato/simbolo,
(= informatica) che introduce il concetto di distinto da informazione —> no al
1982 i due concetti nello sviluppo della IKW Hierarchy continueranno ad essere comunemente
assimilati. (fu il primo a parlare di dati)
“The choice of an logarithmic base corresponds to the choice of a unit for measuring
—> dice
information. If the base 2 is used, the resulting units mai be called binary digits, or more brie y,
bits. A device with two stable position, such as a relax or a ip- op circuit, can store one bit of
information”
→ capisce che devo misurare / quanti care l’informazione -> lui prende un onda e la campiona a
intervalli regolari, man mano che va su registro tot valori numerici che sono la descrizione esatta
di quell’onda -> per fare questo devo inventare il dato però = quello che lui chiama l’unità di
informazione
In questi anni la teoria matematica dell’informazione di Claude Shannon e Warren Weaver
pongono le basi per la moderna comprensione dell’informazione.
1980
Il concetto inizia a prendere forma più chiaramente nei lavori di autori come Milan Zeleny e
Russell Acko , che discutono di come l'informazione possa essere trasformata in conoscenza e
saggezza.
1982 GERARCHIA DIKW
Solo nel 1982 la gerarchia IKW diventò
→ “The Futurist”
in sto anno Harlan Cleveland scrive un articolo nella rivista che riporta una
“L’uomo delle caverne ha un sacco
vignetta divisa in tre riquadri descritti sotto da una didascalia:
di informazioni (fatti e dati). Seleziona le informazioni utili e le trasforma in conoscenza, ma non
raggiunge la saggezza nchè non raggiunge un risultato che è maggiore della somma delle sue
parti”.
- informazione: uomo primitivo osserva coi sensi il mondo intorno a lui -> registra sensazioni.
Raccoglie i dati (che però chiama informazioni) che si predispongono ad avere un signi cato
che nasce dalla contestualizzazione di questi dati.
- knowledge: connette i dati per ottenere una serie di informazioni (sono informazioni anche se
lui le chiama conoscenze) 2
ff fi ffi fi fi fi fl fl fl
fi fi fi fl
- wisdom: fa un ragionamento logico, la contestualizzazione delle informazioni (questa è
conoscenza anche se lui la chiama saggezza)
—> capisce che l’era/società delle informazioni è arrivata + lui ancora non distingue dato da
informazione qua
—> Quindi manca la saggezza quindi = la predizione (le conseguenze che la mia soluzione può
avere)
→Prima vera e propria rappresentazione gerarchica dove l’unione logica delle informazioni genera
conoscenza e l’unione logica delle conoscenze genera la saggezza.
1986-87
Viene introdotto il concetto di dato guidebook to learning for the lifelong pursuit of
Solo nel 1986 un losofo, Mortimer Adler (“A
wisdom”), propone un concetto di scala dell’apprendimento in cui i gradini dell’apprendimento in
sequenza sono: dati, informazione, conoscenza, comprensione, saggezza.
or bee: the human price of technology")
L’anno successivo l’ingegnere Mike Cooley (“Architect
a erma che “i dati opportunamente organizzati e trattati possono diventare informazione, e
l'informazione che viene assorbita, compresa e applicata dalle persone può diventare
conoscenza. La conoscenza frequentemente applicata in un dominio può diventare saggezza, e la
saggezza la base per l'azione positiva”, ponendo di fatto le basi per il modello de nitivo della
piramide DIKW (Data - information - knowledge - wisdom)
PIRAMIDE DIKW
Nessuno dei testi citati nora aveva mai visualizzato in uno schema
piramidale il passaggio tra i vari livelli della scala dell’apprendimento. La
sua prima rappresentazione secondo lo schema di uno ziqqurat fu de nita
da un bibliotecario inglese nel 1987 e la denomina “Piramide della
saggezza” (ha aggiunto la saggezza)
Questa diventa un modello base per tutti gli studi nella scala di apprendimento a livello
knowledge management
informatico e la applica nei sistemi informativi fondando la branca del
= gestione della conoscenza —> branca dell’informatica
Il knowledge management la adotta come modello base di gestione della conoscenza
si occupa di elaborare, raccogliere,
→ prende forma negli anni 90 sempre in ambito informatico
sviluppare, conservare e rendere accessibile la conoscenza delle persone che fanno parte
di una organizzazione o di un’azienda
3 FATTORI CHIAVE che determinano lo sviluppo del knowledge management:
L'avanzamento delle tecnologie dell’informazione:
1. che rende possibile la raccolta e l'analisi
di grandi volumi di dati.
Il passaggio da un'economia industriale a una basata sulla conoscenza:
2. dove il valore
deriva sempre più da risorse intellettuali piuttosto che siche, da un’economia dei beni a
un’economia del sapere
L’aumento della complessità organizzativa e dei mercati a seguito della globalizzazione:
3. più sono i dati più si chiede aiuto all’automatizzazione, si richiede un approccio più so sticato
alla gestione delle informazioni e della conoscenza.
DATI
I dati sono la raccolta e misurazione di un fenomeno reale: sono, per così dire la registrazione
grezza di quei fenomeni, quello che i nostri sensi registrano prima ancora di attribuire a questi un
Sono dei signi canti.
signi cato. quindi I dati sono quindi registrazione di un fenomeno non
codi cato, né strutturato, seppur reale e sico. = simboli che registrano dei fenomani
- Verrebbe, pertanto, da dire che i dati sono oggettivi e incontrovertibili, costituiscono cioè l’unica
verità oggettiva. In realtà, non è così (ricorda cosa abbiamo detto prima relativamente alle
ri essioni sul relativismo di Wiener ed Eliot), la registrazione di un dato è già una codi cazione 3
ff
fl fi fi fi fi fi fi fi fi fi fi fi
di quel dato sia essa un concetto o un valore numerico in base a una certa classi cazione o
unità di misurazione: se cambiamo il modo di codi care il dato, cambia anche il dato. Di questo
ragioneremo più avanti parlando dell’entropia di Shannon.
- “The Futurist”
Per comprendere meglio il concetto di dato guardiamo la vignetta di di prima e
scopriamo che è sbagliata: quello che viene de nito “informazione” nel primo riquadro è invece
il dato, ossia l’elemento signi cante (“conigli ”, “suolo”, “lupi”).
INFORMAZIONI
Un’informazione è il signi cato che possiamo dare al collegamento dei dati raccolti in base
a un contesto interpretativo, per facilitarne la comprensione, l'interpretazione o l’analisi. (tempo,
spazio)
- le lettere dell’alfabeto sono dati, le parole danno un signi cato alla loro
Per esempio
unione, così come la struttura sintattica dà signi cato all’unione delle parole.
- Anche qui la vignetta di “The Futurist” è sbagliata: il secondo riquadro non rappresenta la
conoscenza, ma l’informazione e vediamo come essa si ritraduce nella concatenazione di dati:
“i conigli mangiano l’erba”, “l’erba cresce nel suolo”
- domande strutturate “chi?” o “cosa?”,“dove?”,“quando?”.
L’informazione risponde a come
- Per esempio, nel caso di tracciamento dei dati in rete, i dati potrebbero essere: IP=192.168.0.1,
h=12:30, url=https://www.google.com/search?client= refox-b-d&q=case+in+a tto.
L’informazione che ne deriva collegando questi dati è: il computer che corrisponde all’indirizzo
in rete 192.168.0.1, alle ore 12:30 si è collegato a Google per cercare il termine “case in a tto”.
l’informazione o re una cornice interpretativa ai dati in base alla cronologia degli eventi
in questo caso.
CONOSCENZA
Conoscenza è il risultato generato dal collegamento tra le varie informazioni in base a un
criterio logico (deduzione, induzione, abduzione)
- “i
Nella vignetta di The Futurist conoscenza è il risultato che deriva da questa sequenza logica:
conigli mangiano l’erba” —> “l’erba cresce nel terreno” —> “la pioggia cade dal cielo” —>“i lupi
deduzione):
mangiano i conigli”, quindi ( “se uccido tutti i lupi, i conigli mangeranno l’erba e il
terreno verrà irrigato”
- domande non strutturate “come?” “perchè?”
L’informazione risponde a come o
- Diversi possono essere i criteri logici che de niscono una sequenza e un risultato. Qui ci
limiteremo ai 3 approcci cognitivi di base:
- Conoscenza oggettiva, dichiarativa (know-that): abbiamo la certezza oggettiva della
sequenza logica e del risultato. Per esempio: “Tutti gli uomini sono mortali” —> “Socrate è
un uomo” —> “Socrate è mortale”
- Conoscenza procedurale (know-how): abbiamo le competenze, le abilità pratiche o la
capacità di ottenere un risultato. Conosciamo cioè la procedura, sequenza, per risolvere un
problema pratico come suonare uno strumento musicale, riparare un automobile, cucinare
una ricetta etc.
- Conoscenza causale (know-why): abbiamo competenze, abilità, esperienze per analizzare,
valutare e collegare informazioni in contesti nuovi e risolvere problemi in modo creativo.
SAGGEZZA
Saggezza è il risultato generato dal collegamento tra le conoscenze pregresse in vista di
ottenere una previsione futura.
- Nonostante il knowledge management prenda in considerazione anche la wisdom, ossia la
saggezza, in realtà possiamo concordare tutti che tale concetto sia molto elusivo. Non è un caso
Jennifer Rowley analizzi sedici manuali di knowledge
che (The wisdom hierarchy, 2007)
management solo 3 riportino il
e di information science che illustrano la piramide DIKW, ma
livello wisdom. Sarebbe forse più corretto considerarla solo un altro approccio alla conoscenza,
quello della conoscenza predittiva, su cui si basano anche molti sviluppi di intelligenza arti ciale
legati al machine learning.
IL KNOWLEDGE MANAGEMENT E LA PIRAMIDE DIKW: TECNOLOGIE APPLICATE 4
ff fi fi fi fi fi fi fi fi ffi fi ffi fi
tecnologie
il knowledge management ha sviluppato per ogni livello della gerarchia delle di rete
infrastrutturali predisposte alla gestione dei dati, delle informazioni e delle conoscenze (ogni livello
CATEGORIE DI TECNOLOGIE:
della piramide è gestito da una
- gestione dei dati sistemi di data mining
→ da -> la raccolta dei dati avviene tramite sistemi
gestionali in grado di raccogliere automaticamente i dati e registrarli su un database . Per
questo tipo di processo vengono utilizzate tecnologie di Data Mining che collegano tra loro i
dati relativi ai diversi processi di un’azienda relazionando in maniera strutturata i dati immessi
dalle varie aree dell’organizzazione: nance, risorse umane, engineering, marketing, operations.
( raccolgono puliscono e ottimizzano i dati ( venivano usati 3 server: il primo raccoglie dati, il secondo li ricompone, il
terzo visualizza i dati che venivano raccolti in tempo reale)
- gestione delle informazioni sistemi di business intelligence
→ da -> per l’elaborazione dei
dati in informazioni vengono utilizzate tecnologie di Business Intelligence, chiamate anche data
integrator. I data integrator si occupano di: recuperare i dati dai vari sistemi esterni, ottimizzarli
(p.e. eliminando i duplicati), de nirne le relazioni logiche. (traduce i dati in report, dashboard,
visualizzazioni per mostrare i fenomeni)
- gestione delle conoscenze data analysis
→ da sistemi di -> per l’elaborazione delle
informazioni in conoscenza, dati e informazioni vengono solitamente aggregati in forma visuale
all’interno di dashboard o webapp interattive online (p.e. Google Analytics, Brand24,
Talkwalker) de niti sistemi di Data Analysis in grado di o rire strumenti per modi care criteri e
variabili e ottenere in tempo reale i risultati desiderati. (individuano, scavano dati, relazioni e costruiscono
modelli interpretativi che non erano visibili esplicitamente prima—> rielaborano le informazioni)
- gestione della saggezza predictive analysis
→ da sistemi di -> l’analisi predittiva è ancora
nella grande maggior parte dei casi un’analisi tipicamente umana, anche se con i recenti
sviluppi sul machine learning si cominciano a utilizzare sistemi di Predictive Analysis, come p.e.
SAP Analytics Cloud (SAC) (https:// www.sap.com/italy/products/analytics.html) che è in grado
di elaborare anche un Business Plan.
oggettività
e soggettività
INFORMATION DESIGN E IL MODELLO DELLA PIRAMIDE DIKW
CONFINE TRA INFORMATION DESIGN E DATA VISUALIZATION
- La Data Visualization rappresenta il processo
che arriva a dei risultati utili a
un’apprendimento contestualizzato e visuale di
tutte le informazioni
- l’Information design è più orientato allo
storytelling, cioè a far comprendere meglio la
narrazione a tutti
Il processo di Information Design può essere vista come l’applicazione del modello DIKW. Diamo
uno sguardo pratico all’esempio illustrato nelle slide = una parte dell’inforgra ca “ITALIA BIO”
DATI
Fonti:
- Super ci, operatori e colture. L’agricoltura biologica in cifre, 2018 (agri.istat.it),
SINAB, su
SINAB.IT si possono scaricare dei dataset interessanti. SINAB è un progetto del Ministero
Politiche Agricole Forestali Alimentari e Turismo
- Cambia la terra. Rapporto annuale 2018 (http://www.cambialaterra.it) 5
fi
fi fi fi ff fi fi
dataset preso in analisi registrava i dati regionali
Il presi singolarmente relativi ai seguenti
indicatori:
- PSR: sviluppo rurale nazionale
programma di del Ministero nanziamenti
➝
- M11: metodo di produzione biologico
Misura 11, adozione del
- Incidenza del M11 sul PSR: nanziamenti hanno supportato l’agricoltura
in che misura i
bio
- Super cie agricola utilizzata (SAU) in generale
- Valori annuali
INFORMAZIONI
I dati vengono incrociati in una tabella divisi in:
- percentuale di super cie agricola BIO
(SAU) utilizzata in modalità
- numero di aziende BIO tendenza nel periodo 1990-2017
La tabella viene convertita in un diagramma di
- discrepanza tra numero di aziende BIO e
il confronto rivela una (linea di tendenza verde)
super ci in ettari e ettivamente coltivate in maniera BIO (gra co a pile)
- per rapportare i valori dei dati a una unità di
è stato indispensabile portarli entrambi
misura uguale, in percentuale
CONOSCENZA
L’esempio riportato si concentra su quest’ultima discrepanza (numero di operatori BIO vs
super ci BIO coltivate)
- il numero di aziende BIO 2017 distribuito su una mappa classi cate per
viene di calore
cluster quantitativi su base regionale (da -2000 arancio a 6000 verde)
- si dispongono numero di aziende BIO per regione e
i dati percentuali del rapporto tra il
l’utilizzo delle super ci coltivate BIO nella regione per vedere chi investe di più
- emergere i dati delle regioni investono di più e di meno
si fanno che (azzurro) (magenta,
ossia utilizzano maggiormente i nanziamenti del PSR)
- Cosa ci racconta questa ra gurazione?
- 9,5% delle risorse pubbliche è stanziato per il biologico, 15,4% delle
Il che rappresenta il
super ci coltivate (didascalia nell’infogra ca totale)
- distribuzione delle aziende BIO non corrisponde agli investimenti:
la
- Lazio (23% investimenti BIO con 4-6mila imprese BIO)
- Campania (1,3% investimenti BIO con la stessa quantità di aziende)
- solo 3 regioni detengono il 56% della super cie biologica
che e investono nel BIO e
sono nel Sud PERCHÈ?
La domanda che bisogna porsi per capire l’andamento e chiudere la narrazione è… 6
fi fi
fi fi ff fi fi ffi fi fi fi fi fi fi fi
ENTROPIA DI SHANNON
Informazione è incertezza
QUANTO MISURA UN’INFORMAZIONE?
PARTIAMO DA UNA RIFLESSIONE: NOI MISURIAMO, QUANTIFICHIAMO QUALSIASI COSA…
MA SI PUÒ MISURARE UN’INFORMAZIONE?...
sì, oggi possiamo dire che un’informazione può pesare tot MB o GB, ma quant’è un GB? Sono
ca. 1 miliardo di Bytes e un Byte sono 8 Bit e qui arriviamo alla ne: non c’è una misura inferiore al
Bit. Ma cosa pesa un bit?
Se noi mettiamo sulla bilancia 1 Kg di prosciutto, questo pesa sempre 1 Kg, ma allora perchè nel
nostro computer immagini fatte di bit delle stesse dimensioni o addirittura immagini uguali,
possono “pesare” in maniera diversa?...
- La nostra risposta sarà: “Dipende…” …da cosa? Risoluzione?... sì, ma tuttavia due immagini
con le stesse dimensioni e la stessa risoluzione possono “pesare” in maniera diversa
- Non è importante da cosa… È importante “dipende”, ovvero da quante “probabilità”
de niscono la rappresentazione di quell’immagine o informazione: per esempio quanti punti-
luce di colore uguale o
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Information Systems: Appunti di Sistemi
-
Information and Knowledge: Appunti di Sistemi
-
Appunti Project and information management
-
Appunti esame di design