XML Tutorial - 2 - Elementi Base
partiamo da un esempio di file xml per evidenziare le caratteristiche basi di un file xml
<?xml version="1.0" ?>
<libro titolo="Titolo del libro">
<capitolo titolo="Titolo del capitolo 1"></capitolo>
<capitolo titolo="Titolo del capitolo 2"></capitolo>
</libro>
La prima riga del documento <?xml version="1.0" ?> identifica il file documento XML specificando la versione.
XML permette di definire quanti tag si voglia purchè essi vengano sempre chiusi. Inoltre è possibile specificare un attributo inserendo il nome dell'attributo con il relativo valore all'interno del tag di apertura dell'elemento.
XML prevede una sintassi abbreviata per gli elementi vuoti che evita di dover specificare il tag di chiusura, terminando il tag di apertura con la sequenza di caratteri "/>", come nel seguente esempio.
<?xml version="1.0" ?>
<libro titolo="Titolo del libro">
<capitolo titolo="Titolo del capitolo 1"/>
<capitolo titolo="Titolo del capitolo 2"/>
</libro>
Le due notazioni per gli elementi vuoti sono equivalenti.
Riassumendo tutti i documenti XML devono essere ben formati e affinchè un documento XML sia ben formato deve rispettare le seguenti regole:
- Ogni documento XML deve contenere un unico elemento di massimo livello (root) che contenga tutti gli altri elementi del documento.
- Ogni elemento deve avere un tag di chiusura o, se vuoti, possono prevedere la forma abbreviata (/>)
- Gli elementi devono essere opportunamente nidificati, cioè i tag di chiusura devono seguire l'ordine inverso dei rispettivi tag di apertura
- XML fa distinzione tra maiuscole e minuscole, per cui i nomi dei tag e degli attributi devono coincidere nei tag di apertura e chiusura anche in relazione a questo aspetto
- I valori degli attributi devono sempre essere racchiusi tra singoli o doppi apici
La scelta dei nomi dei tag deve seguire alcune regole: un tag può iniziare con un lettera o un underscore (_) e può contenere lettere, numeri, il punto, l'underscore (_) o il trattino (-). Non sono ammessi spazi o altri caratteri. Inoltre XML è sensibile all'uso di maiuscolo e minuscolo.
Per quanto riguarda il contenuto, un documento XML può contenere potenzialmente qualsiasi carattere dell'alfabeto latino, cifre e punteggiatura. L'encoding deve essere specificato nell'intestazione del documento, es.
<?xml version="1.0" encoding="iso-8859-1"?>
E' possibile inserire dei commenti tramite le sequenze di caratteri <!-- e --> e possono trovarsi in qualsiasi punto del documento.
Infine per poter inserire caratteri chiavi dell'xml in modo che vengano considerati come semplice testo si fa ricorso alla sezione CDATA.
La sezione CDATA (Character DATA) è un blocco di testo che viene considerato sempre come testo, anche se contiene codice XML o altri caratteri speciali. Per indicare una sezione CDATA è sufficiente racchiuderla tra le sequenze di caratteri <![CDATA[ e ]]>.