Appunti di introduzione all'informatica: HTML e applicazioni web
Cosa si impara in questo modulo
- Come è fatta una pagina web
- Cosa è HTML
- Cosa è e come è fatta una applicazione web
HTML
Come è fatta una pagina del World Wide Web
Quando il browser riceve una pagina web e la visualizza, esso obbedisce a una serie di comandi che gli spiegano che cosa va visualizzato e come. Tali comandi sono contenuti in un file che il server ha mandato via Internet. Essi sono scritti in un linguaggio che si chiama Hyper-Text Markup Language (HTML) e il file ha un nome che finisce con l'estensione .html. Per esempio, la pagina iniziale di un sito tipicamente è contenuta in un file che si chiama index.html. Il browser riceve questo file e lo memorizza sul disco (in una zona apposita chiamata cache). Poi lo visualizza immediatamente. Io non sono nemmeno tenuto a sapere che tale file esiste sul mio disco.
Nomenclatura
I seguenti sono termini frequentemente utilizzati che è utile sapere.
- Browser – Client che invia richieste HTTP su una rete – Alla ricezione di una risposta HTTP invoca l’interprete appropriato per il linguaggio in cui è espressa la risposta (nel nostro caso HTML)
- Web server – Server in attesa di richieste HTTP a cui replica con risposte HTTP
- Web page (o document) – Risorsa ospitata da un web server e richiesta da un browser – Può contenere riferimenti ad altre risorse
- Web site – Una collezione di pagine web interconnesse, dotate di un punto di ingresso (detto home page) – In genere appartengono ad una stessa organizzazione (o individuo)
Come è fatto il linguaggio HTML
Si tratta di un linguaggio. Quindi è comprensibile anche alle persone. (Se fosse un protocollo sarebbe comprensibile solo alle macchine.) Infatti si può scrivere “a mano”, direttamente con un text editor. Si tratta di un linguaggio di markup, cioè di annotazione. I linguaggi di markup sono quell'insieme di regole e simboli che si usano nell'editoria tradizionale, per comunicare fra chi decide l'impaginazione di un testo e chi deve realizzarla in pratica.
Per indicare l'impaginazione, l'autore o un editor annota un testo, come p.es. il seguente:
La Divina Commedia di Dante Alighieri INFERNO/Inferno: Canto I Nel mezzo del cammin di nostra vita/mi ritrovai per una selva oscura/ché la diritta via era smarrita. Ahi quanto a dir qual era è cosa dura/esta selva selvaggia e aspra e forte/che nel pensier rinova la paura!
con indicazioni del tipo seguente:
<frontespizio>
<titolo>La Divina Commedia</titolo>
<autore>di Dante Alighieri</autore>
</frontespizio>
<testo>
<titolo-sezione>INFERNO</titolo-sezione>
<titolo-capitolo>Inferno: Canto I</titolo-capitolo>
<strofa>
<verso>Nel mezzo del cammin di nostra vita</verso>
<verso>mi ritrovai per una selva oscura</verso>
<verso>ché la diritta via era smarrita.</verso>
</strofa>
<strofa>
<verso>Ahi quanto a dir qual era è cosa dura</verso>
<verso>esta selva selvaggia e aspra e forte</verso>
<verso>che nel pensier rinova la paura!</verso>
</strofa>
</testo>
La persona che esegue l'impaginazione riceve dal grafico (chi decide l'aspetto esteriore della pubblicazione) le regole per impaginare le varie parti: come deve essere un frontespizio, come deve essere un titolo, come deve essere l'indicazione dell'autore... (eccetera). Seguendo tali regole, si otterrà alla fine una cosa simile alla seguente: La funzione del linguaggio HTML è esattamente la stessa. Addirittura, l'aspetto esteriore dei comandi è analogo a quello illustrato nell'esempio dell'editoria tradizionale.
Il linguaggio HTML è standardizzato dal WWW Consortium (W3C), un consorzio di ditte anche notevolmente importanti (Microsoft, IBM) impegnate nello sviluppo del WWW. Si tratta di uno standard industriale (ossia nessuna legge impone di adottarlo). Infatti non si autodefinisce “standard” ma “raccomandazione”. Lo standard attualmente adottato è la versione HTML 4.01 (che significa: quarta edizione con aggiunte alcune piccole varianti). Si può ottenere (gratuitamente) all'indirizzo http://www.w3.org/TR/html401/
Altra nomenclatura e concetti base
Un file HTML contiene due parti:
- Una intestazione, che comprende solo istruzioni accessorie, ma non il contenuto della pagina web;
- Un corpo, che comprende il contenuto della pagina web.
In HTML qualunque documento web ha quindi la struttura che segue:
<html>
<head>Qui vanno informazioni generali</head>
<body>Qui va il contenuto del documento</body>
</html>
(Al browser, che legge questo file, non importano gli spazi, i rientri, né come vado a capo, e nemmeno le maiuscole o minuscole; posso scegliere di ordinare le righe nel modo più chiaro per me.) I comandi compresi fra < e > si chiamano tag. I tag che abbiamo visto hanno tutti una versione “inizio” e una versione “fine” (che si riconosce perché il nome del tag inizia con la sbarra / ). Ne vedremo altri che hanno solo la versione “inizio” (perché la versione “fine” non è necessaria).
Cosa va nell'intestazione
Nell'intestazione si possono mettere dei tag relativi a informazioni che descrivono il documento, la lingua che usa, ecc. L'informazione che più di frequente viene indicata è un titolo con cui riferirsi al documento
<title>Home page del mio sito</title>
Questa informazione non è il titolo che verrà visualizzato in