INFORMAZIONE, CONOSCENZA E WEB PER LE SCIENZE UMANISTICHE
PREFAZIONE
L’informatica è la disciplina che si occupa del trattamento automatico dell’informazione e più in particolare della sua
rappresentazione, conservazione e trasmissione. Questa definizione definisce oggetto e obiettivi dell’informatica ma
non rende ragione della pervasività che l’informatica ha in tutti i campi della nostra vita.
Questo sapere si presenta spesso come una conoscenza essenzialmente pratica (saper fare o saper usare). Ma questa
conoscenza di ordine pratico è sufficiente per comprendere i fenomeni? Che ruolo ha l’umanista in questo contesto?
La natura e la storia dell’informatica
E’ difficile inquadrare storia e natura dell’informatica in modo unitario. L’informatica è soprattutto un territorio nuovo in
cui si giocano competenze esistenti. Ha una natura profondamente interdisciplinare.
La storia dell’informatica è un insieme di storie collegate: la storia antica dei metodi e delle teorie del calcolo fino alla
storia delle nuove tecnologia di recente scoperta. Vi sono inoltre le storie dei software e dei linguaggi di programmazione,
del WEB… Le scienze umanistiche hanno profondamente contribuito alla nascita di questi saperi.
Un altro aspetto fondamentale è che nell’informatica quello che apparentemente è calcolo, diviene mondo: la realtà
virtuale. Un videogioco o un film d’animazione producono un’esperienza cognitiva completa più ampia del codice che lo
genera.
Il digital divide
Con il termine digital divide si indica un fenomeno sociale e culturale caratterizzato dal divario che esiste tra chi ha
accesso alle teorie della comunicazione e chi ne è escluso. Lo possiamo pensare in grande (popolazioni diverse) o in
piccolo (all’interno della stessa popolazione).
Innanzi tutto è necessario l’accesso alle tecnologie. In secondo luogo, la disponibilità materiale delle tecnologie non è
sufficiente senza una competenza e una conoscenza degli strumenti tecnologici. L’alfabetizzazione informatica consiste
nell’esigenza di formare le persone nell’uso della tecnologia per superare il divario.
Una distinzione più sottile è quella tra chi sa usare e chi conosce. Se dobbiamo pubblicare un contenuto su internet
dobbiamo saper costruire un sito (saper usare) ma se vogliamo che questo contenuto sia efficace, dobbiamo conoscere il
criterio con cui viene letto e interpretato dagli utenti, dobbiamo garantirgli una buona visibilità sui motori di ricerca,
pubblicizzarlo su un blog… (conoscere).
Informatizzare gli umanisti
Vi sono due approcci alla scienza dell’informatica: la conoscenza di metodi e strumenti informatici e la conoscenza
dell’informatica in sé, come problema culturale e teorico.
C’è quindi un’informatica umanistica che studia gli elementi dell’informatica alla luce di questioni umanistiche:
problemi filosofici, culturali, logici… tipici delle discipline umanistiche.
Gli umanisti sono chiamati a svolgere un ruolo di mediazione e di guida nello sviluppo dei progetti comunicativi.
________________________________________________________________________________________________
CAP. 1 – DATI, INFORMAZIONI, SISTEMI INFORMATIVI
Par dato si intende la descrizione di una caratteristica della realtà costituita da simboli che ne garantiscono la
comprensione e registrata su un supporto che ne garantisce la conservazione (il valore 2005 scritto su un foglio).
Per informazione si intende invece l’interpretazione di un dato in grado di arricchire la nostra conoscenza (2005 associato
al titolo di un film e alla dizione “anno di produzione”).
Al dato viene associato un contesto interpretativo che consente di comprendere il significato del dato rispetto alla sua
funzione descrittiva di una certa realtà (il data rappresenta l’anno di produzione di un certo film).
Memorizzazione dei dati e basi di dati
Una base di dati (database) è una collezione di dati correlati creata con lo scopo di rappresentare e memorizzare le
informazioni relative a una realtà di interesse; caratteristica fondamentale è che i dati memorizzati vengono continuamente
aggiornati nel tempo. 1
I sistemi di gestione di basi di dati (DBMS)
Un sistema di gestione di basi di dati (DBMS, Database Management System) è un sistema software realizzato per
supportare le definizione e la manipolazione della base di dati da parte degli utenti. Un DBMS offre le seguenti principali
funzionalità:
- fornisce agli utenti una visione di alto livello dei dati nascondendo i dettagli di basso livello
- garantisce accessi contemporanei
- garantisce la sicurezza dei dati ovvero permette l’accesso ai dati solo agli utenti autorizzati
- fornisce la possibilità di definire una visione personalizzata dei dati per le diverse tipologie di utenti e
applicazioni
- fornisce funzionalità di salvataggio e ripristino (backup e recovery) dei dati contenuti nella base di dati
- assicura la coerenza dei dati contenuti nella base di dati facendo in modo che su di essi vengano rispettati un
insieme di vincoli di integrità.
In termini concreti un DBMS realizza un modello di dati. Il modello descrive la struttura dei dati che caratterizzano la
realtà di interesse a cui si riferisce la base dei dati. Un modello dei dati deve rappresentare degli oggetti del mondo reale
(l’attrice U. Thurman, il film Pulp Fiction), degli insiemi di oggetti (l’insieme degli attori, l’insieme dei film), dei legami
o associazioni fra gli oggetti (U. Thurman ha recitato in Pulp Fiction) e delle caratteristiche o attributi degli oggetti (il
nome degli attori, i titoli dei film).
La descrizione delle caratteristiche dei dati di un database utilizzando un modello dei dati costituisce lo schema della base
di dati: lo schema fornisce una descrizione del contenuto del database, sostanzialmente invariante nel tempo (componente
intensionale della base di dati e quindi definito una sola volta).
Per definire correttamente lo schema del database bisogna procedere a una concettualizzazione delle informazioni sulla
realtà osservata ovvero alla rappresentazione della realtà di interesse in termini degli insiemi di oggetti che la
rappresentano, delle loro caratteristiche e dei legami che intercorrono fra di essi.
Il primo passo nello sviluppo di un database è rappresentato dalla definizione del suo schema.
I dati veri e propri contenuti nella base di dati costituiscono lo stato corrente o insieme delle istanze della base di dati
(componente estensionale). Lo stato varia nel tempo per riflettere gli aggiornamenti. Il DBMS garantisce che ogni stato
sia valido ovvero che i dati inseriti e modificati verifichino la struttura e i vincoli sui dati definiti nello schema.
In questo testo viene considerato il modello relazionale che rappresenta il modello dei dati sul quale si fondano la maggior
parte delle basi di dati e dei DBMS oggi disponibili.
Dati e livelli di astrazione
Una base di dati gestita da un DBMS può essere vista a tre livelli di astrazione:
- livello logico: la rappresentazione dei dati è di alto livello ed è descritta attraverso uno schema logico che
fornisce una descrizione dell’intera base di dati vicina alla concettualizzazione della realtà (tabella FILM in cui le
colonne rappresentano i vari attributi che caratterizzano i film e le righe descrivono i diversi film);
- livello fisico: la visione dei dati è di basso livello ed è descritta attraverso uno schema fisico in cui si
considerando direttamente i record che descrivono i vari oggetti, memorizzati in file su un supporto fisico come,
per esempio, file sequenziali su disco; questo livello è nascosto all’utente;
- livello esterno: i dati vengono presentati a utenti diversi secondo schemi esterni differenti, detti viste, che
contengono un sottoinsieme di tutti dati, quelli di interesse per lo specifico utente (vista relativa ai soli film
americani e un’altra relativa ai soli film italiani).
________________________________________________________________________________________________
CAP. 2 – SEMANTICA DEI DATI: ONTOLOGIE E RAPPRESENTAZIONI DELLA
CONOSCENZA
La parola ontologia compare nel XVII secolo per indicare una disciplina filosofica che si occupa della conoscenza
dell’essere in quanto tale. L’originale di questa disciplina nasce con Aristotele all’interno della filosofia prima o
metafisica o teologia razionale.
L’ontologia si occupa di conoscere ciò che rende una sostanza ciò che è, ovvero la sua essenza, e non la sua
categorizzazione rispetto agli universali e ai generi.
In informatica l’ontologia affronta il problema sulla tipologia di significati che il linguaggio utilizzato è in grado di
rappresentare. Non importa un discorso sull’essere ma un discorso sulle possibilità del linguaggio di rappresentare la
realtà. E’ l’uso del linguaggio che costituisce l’essere e la realtà in informatica. 2
Ontologie e informatica: concetti introduttivi
A partire dagli anni ’80 il termine ontologia entra a far parte della terminologia informatica e più specificatamente nelle
discipline dell’Intelligenza Artificiale e dell’Ingegneria della Conoscenza. Negli anni ’90 con internet le ontologie hanno
acquisito una rilevanza sempre maggiore.
________________________________________________________________________________________________
CAP. 3 – LA PROGETTAZIONE CONCETTUALE
La maggior parte dei problemi nella gestione dei dati può essere risolta con una corretta rappresentazione dei dati stessi.
La progettazione concettuale ha per scopo la produzione di uno schema concettuale ovvero di un diagramma che,
utilizzando uno specifico formalismo, rappresenti la realtà di interesse in termini di classi di oggetti e relazioni fra tali
classi. Uno dei formalismi più usati è il modello Entità-Relazione (modello ER).
Entità e attributi
Un’entità nel modello ER rappresenta una classe, o insieme, di oggetti della realtà che hanno proprietà comuni ed
esistenza autonoma ai fini dell’applicazione di interesse.
Ogni entità all’interno di uno schema ha un nome univoco che la identifica ed è rappresentata graficamente da un
rettangolo. L’entità rappresenta sia insiemi di oggetti concreti come persone sia insiemi di oggetti astratti come l’opera
cinematografica (esempio: entità “Film” come l’insieme dei film archiviati e l’entità “Persona” come l’insieme di persone
che lavorano nel cinema).
Ogni entità è caratterizzata da un insieme di proprietà elementari comuni agli oggetti della realtà rappresentati dall’entità.
Ogni proprietà è rappresentata da un attributo che denota una caratteristica specifica degli oggetti dell’entità: gli attributi
sono caratteristiche che dipendono dall’entità e non hanno dunque un’esistenza autonoma nella realtà descritta; sono
rappresentati nel modello ER con piccoli cerchi associati al nome dell’attributo e collegati da una linea all’entità a cui si
riferiscono. Es.: entità “film” / attributo “codice”, “titolo”, “anno”, “durata” – entità “persona” / attributo “nome”,
“nazione”, “data di nascita”.
FIGURA 3.1
Relazioni fra entità
Una relazione fra entità rappresenta un legame logico fra due o più entità; nel modello ER ha un nome che la identifica ed
è rappresentata graficamente per mezzo di un rombo, connesso alle entità poste in relazione per mezzo di una linea.
Es.: la relazione “troupe” rappresenta il legame che intercorre tra l’entità “film” e l’entità “persona”.
Anche le relazioni possono avere attributi: in questo caso l’attributo rappresenta una caratteristica non di una delle entità
coinvolte ma piuttosto del loro legame logico.
Es.: l’attributo “ruolo” da intendersi non come una caratteristica di un film o di una persona ma come una caratteristica
propria del legame fra una persona e un film per il quale lavora.
Un relazione può interessare anche la stessa entità; in questo caso si parla di relazione ricorsiva. Es.: la relazione
“remake” sull’entità “film” ha due direzioni (rifacimento / originale).
FIGURA 3.2
Cardinalità delle relazioni
Ogni relazione rappresenta un legame logico fra oggetti di due entità: il numero minimo e massimo di combinazioni, o
corrispondenze, che si possono avere fra gli oggetti delle due entità nella realtà di riferimento prende il nome di
cardinalità della relazione.
Considerato che ogni relazione ha due sensi di lettura è importante indicare il numero minimo e massimo di
corrispondenze in entrambe le direzioni.
Data una relazione R fra due entità A e B, determinare la cardinalità di R consiste nel domandarsi quanti oggetti B possono
corrispondere a un oggetto A come minimo e come massimo rispetto al significato del legame rappresentato da R; la
domanda si ripete poi nell’altro senso.
Es.: nella relazione “cast” tra “film” e “persona” ci chiederemo, dato un film, quante persone possono fare parte di un cast
(zero per i film di animazione) e, data una persona, a quanti film può essere associata dalla relazione cast ovvero in quanti
film abbia recitato (zero nel caso in cui la persona non sia un attore). 3
FIGURA 3.3
Identificatori
Un identificatore di un’entità E è una collezione di attributi e/o entità connesse a E che permettono di identificare
univocamente gli elementi di E.
Es.: il codice attribuito ad un film che, come il codice fiscale, lo identifica in modo univoco.
Nello schema un identificatore è contrassegnato annerendo il cerchio che denota l’attributo corrispondente.
Un identificatore può essere composto anche da più attributi; ciò avviene quando un solo attributo non è sufficiente
all’identificazione ma occorre considerare l’insieme di più caratteristiche di un’entità.
Es.: per identificare una persona in un gruppo può non essere sufficiente il solo nome o il solo cognome, mentre l’insieme
di nome e cognome può costituire un identificatore valido.
Infine vi sono entità che non hanno un identificatore univoco, nemmeno considerando tutti i loro attributi. In questo caso
per l’identificazione di un’entità E – denominata entità debole - bisognerà ricorrere alla combinazione dei suoi attributi
con quelli di altre entità in relazione con E.
Es.: per identificare uno studente universitario non è sufficiente il numero di matricola in quanto lo stesso dovrà essere
correlato necessariamente all’università frequentata dallo studente. L’entità studente è l’entità debole mentre l’entità
università funge da entità forte.
Gerarchie di generalizzazione
Mentre le relazioni viste in precedenza rappresentano un legame generico fra entità, le gerarchie di generalizzazione
rappresentano un legame di specializzazione di un entità rispetto ad un’altra: se esiste una gerarchia di generalizzazione
tra un’entità E e un’entità E1 ciò indica che ogni oggetto che è elemento di E1 è anche elemento di E ma non viceversa (=
nozione di sottoinsieme).
L’entità più generale è denominata entità padre mentre le entità più specifiche prendono il nome di entità figlie; il
legame tra le due è rappresentato da una freccia orientata dall’entità figlia all’entità padre.
Le gerarchia può essere:
- totale (T) se l’unione degli insiemi delle entità figlie coincide con l’insieme degli oggetti rappresentati dall’entità
padre; altrimenti si dice parziale (P)
- esclusiva (E) se costruendo un insieme che contenga tutti gli oggetti che sono elementi di tutte le entità figlie,
ovvero l’intersezione delle entità figlie, l’insieme ottenuto non contiene alcun oggetto ovvero ogni oggetto
compare al più in una sola delle entità figlie: la gerarchia è esclusiva quando le entità figlie non hanno
intersezione; altrimenti si dice sovrapposta o overlapping (O)
FIGURE 3.4
Indicazioni metodologiche per la progettazione
FIGURE 3.5 E SEGUENTI
________________________________________________________________________________________________
CAP. 4 – MODELLO RELAZIONALE
Nel modello relazionale dei dati (Codd, 1970) i singoli dati acquistano valore di informazione quando vengono messi in
relazione tra loro. Il modello è fondato sulla nozione matematica di relazione che fornisce non solo la base teorica per la
rappresentazione dei dati ma anche lo strumento fondamentale per lo studio delle proprietà dei dati e delle operazioni su di
essi. La rappresentazione dei dati avviene per mezzo di tabelle.
Il modello relazionale è divenuto quello più importante: oggi è quello più usato in quasi tutti i DBMS.
Un relazione (o tabella) è caratterizzata da un insieme di righe, dette anche tuple, e da un insieme di colonne, dette anche
attributi.
FIGURE 4.1
Teoria del modello relazionale 4
Definiamo una base di dati relazionale un insieme di relazioni R, ognuna delle quali descrive una classe di oggetti della
realtà di riferimento.
Per dominio intendiamo un insieme di valori, come ad esempio l’insieme delle stringhe di testo, l’insieme dei numeri
interi, l’insieme delle date,…
Il prodotto cartesiano è invece un’operazione su insiemi.
Per rendere più semplice l’interpretazione e l’accesso ai dati si può aggiungere ad ogni colonna un nome e l’indicazion
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Riassunto esame Informatica, prof. Ferrara, libro consigliato Informazione, conoscenza e web per le scienze umanist…
-
Riassunto esame Media digitali, docente Dondi, libro consigliato Stati di Connessione, Boccia Artieri
-
Riassunto esame Media digitali, Prof. Ricci Emiliano, libro consigliato Storia dei media digitali , Gabriele Balbi …
-
Riassunto esame Nuovi media, prof. Degiovanni, libro consigliato Le arti multimediali digitali, Balzola, Monteverdi