vuoi
o PayPal
tutte le volte che vuoi
Platone… perché la scrittura debilita la memoria). I libri hanno facilitato la riflessione, l’analisi. Il primo
nucleo librario importante è stato quello intorno ad Aristotele e alla sua scuola, e il modello della biblioteca
aristotelica diventerà pi la base della Biblioteca di Alessandria, memoria dell’ellenismo. L’accumulo di
sapere all’epoca non serviva per la sua diffusione, ma per la sua rielaborazione e produzione di nuovo
sapere. Solo in epoca romana nascono le prime biblioteche pubbliche. Con il medioevo tutto si sposta
nelle mani della cristianità, e le biblioteche diventano centri di copiatura. Con i secoli l’uomo ha migliorato
le tecniche di riproduzione, di classificazione e i supporti: da grandi lastre monolitiche a piastre circolari,
fino ai rotoli della biblioteca di Alessandria. Solo nel I d.C. compare il libero quadratus, fogli di papiro riuniti
insieme rilegati tra loro: è il Codex. Il codice, più maneggevole e comodo da consultare diventa il supporto
più usato, ed è stato mantenuto anche con l’avvento della stampa. Solo nell’Ottocento la diffusione delle
macchine tipografiche ha favorito la diffusione delle pubblicazioni periodiche. Aumenta l’alfabetizzazione e
la produzione libraria viene incrementata: le biblioteche diventano simili a come le conosciamo oggi. Oltre
all’evoluzione della stampa si sviluppano altre innovazioni tecnologiche che hanno cambiato
profondamente il modo di produrre e diffondere la conoscenza: nascono la fotografia e il cinema
nell’Ottocento. Nel Novecento fanno la comparsa i mass media. I libri non sono più l’unico mezzo di
comunicazione della conoscenza, con un impatto straordinario sulla società (radio e tv…). Eppure il
cambiamento epocale c’è stato alla fine del Novecento con la rivoluzione digitale e l’avvento d Internet. Si
sviluppano anche biblioteche digitali, che possono contenere di tutto, da libri a giornali a testi visivi o
audiovisivi o sonori, ad archivi storici a file di archivi amministrativi… insomma ogni oggetto digitale o
digitalizzabile. Internet è una enorme Biblioteca Digitale, che comprende tutti gli oggetti digitali esistenti, li
ordina, li conserva e li rende fruibili. Xanadu è un progetto mai realizzato di iperteso universale: è un unico
universo di documenti liberamente fruibile da cui si può raggiungere tutta la conoscenza umana. Era
un’utopia che con Internet diventa fattibile.
5.3 - Qualche nozione utile: metadati e “information retrieval”
•• I metadati sono dati che descrivono altri dati. Sono informazioni su documenti, testi e oggetti di varia
natura, strutturate in cambi che ne permettono una organizzazione, una gestione e un recupero più
efficienti. I metadati sono simili alle schede catalografiche bibliotecarie (schedine custodite in archivi): i
metadati esistono da quando esistono le raccolte di documenti. Già il titolo e l’autore sul cartellino
attaccato al rotolo del libro della biblioteca di Alessandria sono metadati. Esistono anche software che
associano automaticamente al documento dei metadati. Ci sono ovviamente indicizzati professionali che
analizzano il documento e decidono quali termini normalizzati associarvi.
•• L’information retrieval è l’insieme delle tecniche usate per il recupero mirato delle informazioni digitali,
come documenti, metadati o altri oggetti presenti sul www o in archivi digitali. In senso stretto si usa
questo termine per indicare i linguaggi di interrogazione basati su comandi testuali tipici delle banche dati
commerciali online spesso usati in altri contesti come banche dati su CD, cataloghi automatizzati di
biblioteche, motori di ricerca… La distinzione fondamentale che è alla base dell’informazione retrieval è tra
la ricerca di una o più parole nell’intero testo di un documento primario (come un libro, un blog, un
articolo) e la ricerca delle stesse parole tra i metadati. Ci sono diversi metodi di ricerca, dal semplice
scorrimento al complesso multimedia information retrieval, che permetterebbe la ricerca di documenti non
testuali senza passare dai metadati testuali. : ogni documento elettronico deve essere trattato tramite gli
elementi di linguaggio più adatti alla sua natura (information retrieval basato su informazioni testuali per i
testi, un metodo di Visual retrieval per i documenti visivi, un sistema di audio retrieval per l’informazione
sonore - come Shazam -; un video retrieval per i video…). Il linguaggio verbale non ha già il dominio
assoluto nei sistemi di catalogazione.
5.4 - “Folksonomy” e Web 2.0: una definizione
•• La folksonomy (anche detta social o collaborative tagging) è un sistema di categorizzazione
collaborativa delle informazioni tramite assegnazione di metaforiche etichette (tag) liberamente scelte dagli
utenti. Deriva dalla fusione di folk e taxonomy, cioè tassonomia popolare; è il risultato dell’insieme di
pratiche individuali di tagging di oggetti sul web. Molti siti sono dotati di sistemi automatici di correlazione
dei tag, che permettono di associare diversi contenuti simili (“video correlati” su Youtube, ma anche su
Netflix…). La folksonomy nasce nel 2004 per implementare servizi di social bookmarking e classificazione
di immagini. Per web 2.0 si intende l’insieme di siti di nuova generazione nei quali gli utenti possono creare
facilmente le proprie pagine personali, pubblicare user generated content e mettersi in relazione con altri
utenti. L’utente è sempre già centrale. Secondo O’Reilly il web 2.0 è quello all’architettura della
partecipazione. I detrattori invece dicono che il web 2.0 è semplicemente una continuazione dei valori di
libertà, relazione condivisione sempre alla base della cultura di Internet di Tim Berners-Lee. Però le
applicazioni del web 2.0 hanno effettivamente abbassato la soglia di conoscenze tecniche necessarie per
compiere azioni che in passato erano solo per poche persone. Sia il web 2.0 sia la folksonomy sono fattori
di democratizzazione della società perché offrono agli utenti un maggiore controllo sui flussi di
informazione. Nel web 2.0, a differenza di biblioteche e archivi con professionisti che categorizzano le
informazioni, sono gli utenti ad assegnare tag ai contenuti.
5.5 - “Folksonomy” e potere
•• La gestione del sapere da sempre ha avuto a che fare con il potere. La letteratura era strumento di
propaganda. Nella catalogazione delle opere vi è un grande potere di ricontestualizzazione. L’attribuzione
dei significati di un testo dipende molto dal contesto in cui viene fruito. In base a come cataloghiamo le
poesie di Saffo (poetessa greca tra VII e VI secolo a.C.) - poesie d’amore, Antica Grecia, Omosessualità,
Devianza… - le opere di Saffo verranno trovate o meno dalle persone. Anche la scelta dei criteri di
rilevanza nelle ricerche, correlata alla definizione dei metadati, è una operazione che esercita molto potere.
La maggior parte del potere lo ha il motore di ricerca. Se cerco “bicicletta” su google, avrò tutti i risultati
che nei metadati ma anche nel corpo del testo avranno la parola cercata. Invece se cerco “bicicletta” su
Youtube, avrò solo i risultati basati sui metadati, perché il contenuto video non è ancora analizzabile,
quindi il peso del social tagging è in questo caso maggiore.
5.6 - Pregi e difetti della “folksonomy”
•• La folksonomy permette “il miglior disordine possibile” garantendo una classificazione rapida, distribuita
e scalabile per adeguarsi all’ambiente in continuo movimento. La folksonomy è utile se l’archivio è grande,
frequentato e aggiornato continuamente (come in Youtube). Infatti nessuna classificazione rigida e univoca
potrebbe rappresentare la complessità del mondo. La folksonomy rende conto delle diverse attribuzioni di
significato che l’utente può attivare fruendo o pubblicando informazioni online. La folksonomy è poi molto
utile per creare occasioni di serendipity, cioè la scoperta di cose impreviste mentre se ne stavano
cercando altre, attraverso anche un nuovo tipo di information retrieval, chiamato pivot browsing, cioè
navigazione libera dei tag. Huberman crede che la folksonomy abbia il difetto di essere ambigua e non
controlla sinonimi e differenze (“New York", “New York City”, “NYC”…). L’ambiguità dei tag può essere
complementare (polisemia, con diversi significati legati - esempio: “collo”) e contrastiva (omonimia, come
nel caso della “vite”). Il problema dei sinonimi rende impossibile recuperare tutte le risorse desiderate. La
granularità indica il grado in cui è suddivisa una entità più grande. Nelle immagini si preferisce parlare di
definizione. Per Ridi sono quattro i difetti della folksonomy: scarsa qualità dei tag, scarsa copertura di
ambiti documentari, scarsa astrazione, rischio etico di conflitto di interessi tra la figura dell’autore e quella
del catalogatore. Altri problemi nascono con idiomi e alfabeti diversi, con l’uso degli spazi. Tutti questo
difetti hanno come conseguenza l’imprecisione della categorizzazione e quindi della ricerca dei contenuti,
soprattutto per i materiali multimediali in cui i tag pesano di più nella classificazione.
5.7 - “Folksonomy” e ricerca sociale online: una proposta operativa
•• Essendo la folksonomy un metodo che esprime liberamente i punti di vista degli utenti, questa
rispecchia i diversi modi di concepire e interpretare gli avvenimenti. Se dobbiamo ricercare la guerra in
Palestina nel 1948, un ebreo sionista la chiamerebbe “guerra di liberazione nazionale”, mentre un
palestinese “la disfatta”. Alcuni progetti di ricerca cercano di risolvere questi problemi estraendo
semantica, sintassi e pragmatica della folksonomy. Esistono servizi online di clustering 2.0; il più famoso è
il metamotore Clusty, che dispone di dizionari semantici che raggruppano i risultati in base alle analogie
dei loro significati, e rimescolano i risultati nei cluster per evidenziare pagine che altrimenti resterebbero
nascoste. Vergani (autore dell’articolo) invece pone al centro del processo di ricerca la soggettività del
ricercatore e la sua capacità di osservazione e di instaurare relazioni. Prima di effettuare una ricerca di
contenuti online, si deve conoscere approfonditamente il fenomeno sotto indagine, acquisendo mentalità
e vocabolario dei gruppi sociali coinvolti. Si devono quindi studiare i punti di vista dei soggetti,
appropriandosi dei loro termini e delle loro parole. Dalle ricerche, non tutte le keyword potrebbero produrre
risultati e non tutte potrebbero produrre so