Appunti XML - Damiano

Revisionato il 12/06/2026

di Rig_Ce

Publisher

Vota

Contenuto verificato e approvato dal Team di Esperti di Skuola.net

Appunti di fondamenti di informatica basati su appunti personali del publisher presi alle lezioni della prof.ssa Damiano dell’università degli Studi di Torino - Unito, …

Esame Fondamenti di informatica e programmazione

Facoltà Lettere e filosofia

Dal corso del Prof. Damiano Rossana

Università Università degli studi di Torino

A.A. 2016-2017

11 pagine

Appunto

Scarica

Estratto del documento

Fdi 2.1 7 dicembre 2015

Lezione 0: Introduzione a XML

XML è il formato di base per l’interscambio di dati sul web; standard testuale più diffuso. XML è HTML senza i tag perché dobbiamo inventarli noi; XML è un insieme di regole per creare linguaggi come HTML. XML (Extensible Mark-up Language) è uno standard del web consortium [XML 1.1]; deriva da/è una parte di SGML (Standard Generalised Mark-up Language; standard ISO (istituto che rilascia gli standard)) che è uno standard internazionale per la definizione di un metodo di rappresentazione di testi in forma elettronica, indipendenti dal device e dal sistema operativo.

L’XML è un meta-linguaggio, ovvero non ha tag ma solo regole che spiegano come si creano un insieme di tag e come si combinano tra di loro, che permette di definire nuovi linguaggi di mark-up. XML è un semplice formato testuale molto flessibile; originariamente era designato per incontrare le sfide su larga scala per la pubblicazione elettronica. Nato come strumento per codificare documenti in formato elettronico, poi ha avuto una vita propria perché il suo design era talmente ottimale per lo scambio dei dati e facile da trattare per strumenti automatici che è diventato uno standard per trattare dati da device diversi.

Differenze con HTML

Tutti i tag devono essere chiusi o segnati come vuoti
Tutti i valori degli attributi devono essere chiusi dalle doppie virgolette
Non c’è niente di precostituito
Non ci sono le character entities (sono solo cinque in XML: <, &, sono le parentesi angolari, l’& e gli apostrofi/virgolette, etc.)
In XML ci sono i punti unicode, sequenze numeriche per un determinato simbolo; ti puoi costruire direttamente le abbreviazioni per fare questi simboli mentre in HTML questa abbreviazione è già fatta

Scopi del design di XML

XML shall be straightforwardly usable over the Internet.
XML shall support a wide variety of applications (dalla grafica, ai servizi web, le biblioteche digitali).
XML shall be compatible with SGML.
It shall be easy to write programs which process XML documents.
The number of optional features in XML is to be kept to the absolute minimum, ideally zero. Tutto deve essere definito, ci devono essere pochi elementi convenzionali.
XML documents should be human-legible and reasonably clear. Ciò che l’ha reso così importante e famoso.
The XML design should be prepared quickly.
The design of XML shall be formal and concise.
XML documents shall be easy to create.
Terseness in XML markup is of minimal importance.

A cosa serve XML

HTML: layout e formattazione, non dice niente sul contenuto
XML: strutturazione del contenuto (per questo i tag vanno creati di volta in volta, hanno uno scopo preciso), formato di scambio dati, leggibilità, trattamenti automatici, no pubblicazione diretta (non sono fatti per essere pubblicati direttamente sul web)

Quando si parla di XML si parla di linguaggi perché si può tradurre. Trattamento documento XML: può essere visualizzato tramite fogli di stile, per diversi device, con multicanalità e documenti narrativi (c’è un contenuto testuale e non solo dati; ex dati: lista prodotti, schede catalogo beni culturali), permette il trattamento automatico con XSLT (extensible stylesheet language transformations), che permette manipolare la struttura del documento e di convertire in un altro linguaggio. Da solo, XML non produce alcun risultato.

La struttura del documento XML

Each XML document has both a logical and a physical structure. Physically, the document is composed of units called entities (caratteri, numeri). Logically, the document is composed of declarations (all’inizio: “questo è un documento XML”), elements, comments (le nostre annotazioni), character references (punti UNICODE), and processing instructions, all of which are indicated in the document by explicit markup. The logical and physical structures MUST nest properly (se apri un tag devi chiuderlo, devi scriverlo correttamente, etc).

Terminologia

MUST (obbligatorietà), SHOULD (consigliato) e MAY (possibile) sono usati nel senso formale definito in IETF RFC 2119
nata per definire i protocolli di rete
definisce livelli di requisiti che sono regolati dagli standard (RFC).

La struttura logica di un documento XML

Each XML document contains one or more elements, the boundaries of which are either delimited by start-tags and end-tags, or, for empty elements, by an empty-element tag. Tags mark the start and end of an element.

<foo> — start tag </foo> — end tag <foo></foo> — element
Each element has a type, identified by name, sometimes called its "generic identifier" (GI), and may have a set of attribute specifications.
<element-name ...> </element-name>
Each attribute specification has a name and a value.
<element-name attribute-name=value ...> </element-name>

Esempio ricetta ciambella

<?xml-stylesheet type="text/xsl" href="ricetta_semplice.xslt"?> (*) Il documento ha una radice che è il nodo ricetta. Le “foglie” sono i nodi fase perché non hanno altri nodi ma solo testo all’interno [nodi terminali]. Non è narrativo ma solo dati. “Fase” è un’entità. Dal pov procedurale la struttura è ad albero.

Le caratteristiche di un documento XML sono: l’XML declaration (*), il markup (Tag, attributi, struttura gerarchica) e i dati (testo, nell’esempio era il testo della ricetta, e entity references, sezioni CDATA).

Le regole per avere un documento ben formato

Tutti i tag sono chiusi
I tag sono annidati senza incrociarsi (chiuderli nell’ordine inverso a quello in cui vengono aperti)
C’è solo un elemento radice (primo ad aprirsi e ultimo a chiudersi)
Tutti i valori sono tra virgolette
Non ci sono attributi con uno stesso nome per stesso elemento
Non ci sono commenti nei tag
Non ci sono <, &, e altri determinati simboli nei dati o nei valori.

Tipi di errori sono sintattici (tag non chiusi, incrociati, doppie virgolette) o logici (manca un elemento o attributo obbligatorio, l’ordine in cui sono annidati gli elementi non è corretto. Differenza documento ben formato (rispetta regole XML/sintattico) e valido (rispetto ad un linguaggio di riferimento/logico).

DTD (Document Type Definition)

La DTD contiene la grammatica di un linguaggio basato su XML. Conformità di un documento a una DTD: può essere contenuta in un file esterno ** o definita nel documento stesso. Nella DTD si definisce la struttura logica e non fisica del documento (quindi non si parla di tag). Non è importante.

Anteprima

Vedrai una selezione di 4 pagine su 11

Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.

Scarica

Acquista con carta o PayPal

Scarica i documenti tutte le volte che vuoi

Dettagli

SSD

Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Rig_Ce di informazioni apprese con la frequenza delle lezioni di Fondamenti di informatica e programmazione e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli studi di Torino o del prof Damiano Rossana.

Appunti correlati

Invia appunti e guadagna

Recensioni

Ti è piaciuto questo appunto?

Fdi 2.1 7 dicembre 2015

Lezione 0: Introduzione a XML

Differenze con HTML

Scopi del design di XML

A cosa serve XML

La struttura del documento XML

Terminologia

La struttura logica di un documento XML

Esempio ricetta ciambella

Le regole per avere un documento ben formato

DTD (Document Type Definition)

Recensioni

Domande e risposte