vuoi
o PayPal
tutte le volte che vuoi
Però la misurazione non era ancora ottimizzata per i calcoli (il sistema di calcolo dei romani non era fatto
per l’analisi numerica). Una numerazione alternativa è stata sviluppata in India nel I secolo d.C. e poi è
stata tramandata agli arabi, che l’hanno perfezionata: è il sistema dei numeri arabi ancora oggi in uso. Con
l’adozione dei numeri arabi, la matematica dà un nuovo significato ai dati, che adesso si possono anche
analizzare e non solo archiviare e recuperare. La datizzazione si è sviluppata perché l’umanità ha sempre
desiderato misurare la realtà e registrarne i dati, ma in un mondo analogico è una attività costosa sia in
termini di denaro sia di tempo. L’avvento dei computer ha messo a disposizione strumenti di misurazione e
archiviazione digitale che hanno reso la datizzazione molto più efficiente, e ha facilitato di molto l’analisi
matematica dei dati, con la quale possiamo scoprirne il valore nascosto. Insomma: la digitalizzazione
mette le ali alla datizzazione, ma non la sostituisce (la digitalizzazione in sé non datizza).
5.2 - Quando le parole si trasformano in dati
•• Per capire la differenza tra digitalizzazione e datizzazione, pensiamo alla scannerizzazione dei libri in
digitale fatta da Google: digitalizzare i libri trasforma una pagina cartacea in una immagine digitale di quella
pagina, ma solo con la datizzazione quella immagine digitale si “trasforma” in testo. La datizzazione ha
reso i testi indicizzabili e quindi setacciabili. La datizzazione rende anche molto più facile scoprire il plagio.
A questo punto, le parole diventano fossili racchiusi nelle pagine, e gli esperti di culturomica possono
scavare al loro interno come fossero archeologi. Amazon usa i dati provenienti dai libri digitalizzati solo per
vendere quei libri, mentre Google li usa anche e soprattutto per migliorare il suo traduttore.
5.3 - Quando la posizione si trasforma in dati
•• La geolocalizzazione è una informazione, che per essere veramente utile deve essere convertita in dati.
La standardizzazione della longitudine e della latitudine come formati universali per condividere le
informazioni di geolocalizzazione ha richiesto molto tempo. Negli anni Quaranta viene creato il sistema di
coordinate UTM (proiezione universale trasferta di Mercatore), che divide il mondo in 60 zone per
migliorare la precisione. Un cambiamento sostanziale si è avuto nel 1978 quando è stato lanciato il primo
dei 24 satelliti che formano il Global Positioning System (GPS). Quando la posizione viene datizzata,
emergono nuovi usi e si può creare nuovo valore.
5.4 - Quando le interazioni si trasformano in dati
•• Il concetto di datizzazione è alla base degli attuali social network: prendono elementi intangibili della
nostra vita quotidiana e li trasformano in dati che si possono usare per fare nuove cose. Con Twitter è
possibile datizzare le emozioni. La datizzazione consiste nel convertire in forma analizzabile non solo
atteggiamenti e sentimenti, ma anche il comportamento umano, molto difficile da rilevare in altri modi.
5.5 - La datizzazione di tutto quanto
•• L’entusiasmo per “l’internet delle cose” (inserimento di sensori in oggetti di uso quotidiano) ha a che fare
con il networking, ma soprattutto con la datizzazione di tutto ciò che ci circonda. Il progetto della
datizzazione rivaleggia con gli acquedotti romani e con l’Encyclopédie degli Illuministi, e produrrà
cambiamenti radicali nella società. Il fatto di vedere il mondo come una massa di informazioni da esplorare
ci offre una prospettiva sulla realtà che prima non avevamo.
6 - Valore
•• Alla fine degli anni Novanta, gli spambot riempivano chat e forum di spam, così Von Ahn ha inventato i
captcha, qualcosa di facile per gli umani, ma di difficile per le macchine. In seguito Von Ahn ha inventato i
reCaptcha, formati anche da una parola scannerizzata e che doveva essere digitalizzata e datizzata: è
importante il riutilizzo dei dati. Nell’era dei big data, tutti i dati verranno considerati preziosi di per sé. Oggi, i
dati si possono raccogliere passivamente, senza grossi sforzi da parte di chi li crea, spesso anche a sua
insaputa, il tutto a basso costo. Il valore dei dati non diminuisce quando vengono usati, in quanto si
possono riprocessare all’infinito. Le informazioni sono perciò un bene “non competitivo”: il fatto che una
persona le usi non impedisce a un’altra di usarle, in quanto le informazioni non si logorano come fanno i
beni materiali.
6.1 - Il valore opzionale dei dati
•• Si prendono informazioni generate per uno scopo e le si riutilizzano per un altro; si dice allora che i darti
passano da usi primari a usi secondari. Il valore dei dati va calcolato in base a tutti i possibili modi con cui
si potrebbero impiegare in futuro, e non semplicemente in base all’uso che se ne fa attualmente. Tre modi
efficaci per liberare il valore opzionale dei dati: riutilizzo, fusione dei dataset e identificazione delle
possibilità di estensione.
6.2 - Riutilizzo dei dati
•• A volte il valore non deriva dai singoli data point, ma da ciò che rivelano nel loro insieme. Anche le
informazioni più anali potrebbero avere un valore particolare, se impiegate nel modo giusto. Per esempio,
gli operatori di telefonia mobile sanno esattamente dove e quando i telefoni si collegano alle stazioni radio,
conoscendo anche la forza del segnale. Possono usare questi dati per migliorare la performance dei propri
network oppure potrebbero venderli ai produttori di telefoni per aiutarli a capire che cosa influenza la forza
del segnale, per esempio per migliorare la capacità di ricezione dei loro apparecchi.
6.3 - Dati ricombinanti
•• A volte il valore nascosto dei dati può uscire allo scoperto solo combinando un dataset (un insieme di
dati) con un altro, anche del tutto diverso (per esempio lo studio sull’incidenza di tumori presso gli
utilizzatori di telefoni cellulari; per questo studio si sono uniti vari dataset: dati degli operatori sugli abbonati
in Danimarca, registro nazionale dei pazienti oncologici delle autorità sanitarie e registro nazionale con i
dati sul titolo di studio e il reddito disponibile di ogni cittadino danese). Alla fine si è scoperto che non esiste
correlazione tra tumore e uso dei telefoni cellulari.
6.4 - Dati estensibili
•• Per facilitare il riuso dei dati bisognerebbe renderli strutturalmente flessibili sin dall’inizio. Si tratta di
cercare delle possibilità di estensione, così i dati possono crescere di valore (se si raccolgono con certe
modalità che permettono ai dati di prestarsi a vari scopi).
6.5 - Ammortizzare il valore dei dati
•• Quasi tutti i dati perdono una parte della propria utilità con il passare del tempo: continuare a fare uso di
dati obsoleti non solo non crea valore aggiunto, ma azzera anche il valore dei dati più recenti (se Amazon
suggerisse un libro in base a un acquisto fatto dieci anni fa, è molto probabile che non intercetti più i nostri
interessi). Ogni azienda quindi deve ripulire continuamente i suoi archivi ed eliminare le informazioni che
hanno perso valore. Ma come si fa a capire quali dati non sono più utili? Non tutti i dati si deprezzano con
lo stesso ritmo o allo stesso modo. Anche se il valore dei dati diminuisce per alcuni dei loro scopi, il loro
valore opzionale potrebbe rimanere elevato. Bisogna stabilire dunque dei “tassi di ammortamento”.
6.6 - Il valore dei dati a perdere
•• Google ha costruito il suo correttore ortografico a costo zero, riusando gli errori di digitazione inseriti sul
suo motore di ricerca (3mld di ricerche al giorno: “forse cercavi…?”). Il correttore ortografico di Google si
automigliora in continuazione, quindi gli utenti non si preoccupano più di digitare correttamente le parole
chiave. Questo sistema di correzione ortografica dimostra che anche dati “difettosi” possono essere
comunque molto utili. Quando gli utenti indicano a un programma di riconoscimento vocale che ha frainteso
le parole pronunciate, in realtà “insegnano” al sistema a migliorarsi.
6.7 - Il valore dei dati aperti
•• Google ed Amazon non sono i pionieri dei big data. I primi a raccogliere dati su vasta scala sono stati
chiaramente i governi. Una differenza tra imprese e governi è che i secondi possono costringere i cittadini a
fornire loro delle informazioni, invece di doverli persuadere. Il valore dei dati è nascosto e richiede una
analisi innovativa per essere liberato. Comunque i governi si sono dimostrati spesso incapaci a usare
intelligentemente i dati. Ultimamente si crede che il miglior modo per estrarre valore dai dati in possesso
del governo sia consentire al settore privato, o ancora meglio alla società in generale, di accedervi
liberamente: quelli che vogliono questo sono i sostenitori degli “open data”, che chiedono al governo di
divulgare i propri dati per fini sia sociali sia commerciali. Obama nel 2009, appena insediatosi, diffonde una
nota in ci ordina alle agenzie federali di pubblicare il maggior numero possibile di dati: “nel dubbio, prevale
la trasparenza”: queste informazioni sono presenti nel sito data.gov. Grazie agli open data anche chi non
raccoglie dati può ugualmente usare dati raccolti dal governo per creare valore.
6.8 - Stimare l’inestimabile
•• Quando facebook è entrato in borsa, valeva 104mld di dollari, mentre il suo valore contabile (a livello
fisico, di strutture, ma non di dati) era di appena 6mld. Infatti, il metodo usato di solito per stimare il valore
di una azienda, che è fondato sul valore contabile, non riflette più il valore effettivo (il valore di mercato).
L’incapacità di stimare correttamente il valore delle imprese crea anche rischio commerciale e volatilità di
mercato. La differenza tra il valore contabile e il valore di mercato di una azienda è misurata dagli “asset
intangibili” (ovvero brand, talento, strategia, dati… tutto ciò che non è fisico e non rientra nel sistema
formale di contabilità finanziaria). In futuro il valore dei dati verrà esposto in bilancio e costituirà una nuova
categoria di asset (quando non ci saranno preoccupazioni per la responsabilità giuridica). Siccome il valore
dei dati è soprattutto latente (nascosto) e deriva da usi secondari futuri ancora ignori, non è chiaro come si
possano stimare. È certo che cominciano a formarsi delle economie intorno ai dati. Il valore dei dati sta
essenzialmente nel loro potenziale di riutilizzo, apparentemente illimitato. Il valore dei dati risiede
nell’utilizzo, non nel mero possesso.
7 - Implicazioni
•• decide.com è nata d