Xml
Cos'è XML?
XML (Extensible Mark-up Language) è uno standard del Web Consortium (W3C, organizzazione mondiale che si occupa di definire gli standard del web) e che nasce dal tentativo di creare una versione semplificata del linguaggio SGML (standard internazionale che trasforma i testi in formato elettronico). XML è un meta-linguaggio formato da regole che definiscono degli insieme di tag e che li combinano tra loro, creando così nuovi linguaggi di mark-up. Nasce per la pubblicazione di documenti sul web, progettato per andare incontro alle sfide dell'editoria elettronica su larga scala, poi è diventato lo strumento principale per scambiarsi una grande varietà di dati sul web e altrove. È un formato che si basa su testi per rappresentare documenti, dati, libri, transizioni e molto altro ed è il formato più usato per scambiare informazioni strutturate tra utenti e anche tra apparecchiature.
Differenze con HTML
- Tutti i tag devono essere chiusi (altrimenti devono essere specificati come vuoti).
- Tutti i valori degli attributi devono essere chiusi tra le virgolette.
- Non c'è niente di precostituito, neanche i tag.
- Esistono solo le Character Entities strettamente necessarie (&, <, >, “ “, ‘ ). Per i caratteri restanti esistono delle codifiche Unicode.
Scopi del design
XML dev'essere utilizzabile direttamente su internet, senza altri passaggi.
- Deve supportare una grande varietà di applicazioni.
- Dev'essere compatibile con SGML.
- Dev'essere facile scrivere programmi che processano i documenti XML (avendo una struttura piramidale sono ideali per il processing automatico).
- Il numero di caratteristiche (features) dev'essere possibilmente tenuto a 0, poiché lo standard è semplice.
- I documenti XML devono essere chiari e leggibili per gli umani (è il punto che ha reso XML così famoso e usato).
- Il design dev'essere preparato velocemente.
- Sia i documenti di testo che quelli concettuali sono di tipo testuale.
- Il design dev'essere formale e conciso.
- I documenti devono essere facili da creare.
- Il markup dev'essere minimo (il fatto che i tag debbano essere aperti e chiusi facilita la creazione).
A cosa serve?
Serve per gestire il contenuto e la sua struttura. È un formato utilizzato per lo scambio dei dati, chiaro e leggibile e che non viene pubblicato direttamente sul web. Esistono linguaggi che elaborano il documento XML e che lo trasformano in altri formati, per esempio HTML o PDF (trattamento automatico).
Trattamento del documento
Un documento XML si può visualizzare tramite fogli di stile. Possono esistere anche documenti di carattere “narrativo” (con titolo, paragrafo,...) e che sono diversi da quelli usati per esempio per un catalogo. XSLT è un linguaggio che serve a trattare automaticamente un documento XML e a convertirlo in un altro linguaggio, manipolando la sua struttura.
Struttura del documento
Il documento XML ha due tipi di strutture: una logica e una fisica. Quella logica è la struttura vera e propria, formata da elementi che caratterizzati da un mark-up esplicito, come per esempio dichiarazioni, elementi, commenti, unicode, istruzioni. Se il documento non è logico non può essere processato. Quella fisica contiene i caratteri (entities) di cui è composto il documento. Sia la struttura fisica che quella logica devono essere annidate correttamente.
Specifiche (terminologia)
Per identificare i livelli di adeguatezza allo standard si usano queste tre espressioni: Must (obbligatorietà), Should (consigliato) e May.
-
Esercitazione PHP e XML
-
Appunti XML - Damiano
-
Modello semistrutturato ed il linguggio XML
-
Riassunto esame Introduzione all'informatica per l'editoria, prof. Maieli, testo consigliato Un po' di informatica …