RetroSearch Browse

Home - News ( United States | United Kingdom | Italy | Germany ) - Football scores

Showing content from http://www.dkg.it/w3c/TR/2004/REC-xml11-20040204/it/index.htm below:

Linguaggio Estensibile di Marcatura (XML) 1.1

Il Linguaggio Estendibile di Marcatura {Extensible Markup Language}, abbreviato in XML, descrive una classe di oggetti di dati chiamati documenti XML e descrive parzialmente il comportamento dei programmi per computer che li elaborano. XML Ã¨ un profilo applicativo o una forma ristretta di SGML, il Linguaggio Standard Generalizzato di Marcatura {Standard Generalized Markup Language} [ISO 8879]. Nella costruzione, i documenti XML sono conformi a documenti SGML.

I documenti XML sono costituiti da unitÃ di allocazione chiamate entitÃ , le quali contengono dati sia parsed [N.d.T.: analizzati in modo logico] che non parsed. I dati parsed sono costituiti da caratteri, alcuni dei quali formano i dati carattere, altri formano la marcatura. La marcatura codifica una descrizione dello schema di allocazione del documento e della struttura logica. XML fornisce un meccanismo per imporre dei vincoli sullo schema di allocazione e sulla struttura logica.

[Definizione: Un modulo software chiamato un processore XML viene usato per leggere i documenti XML e fornire accesso alla loro struttura e al loro contenuto.] [Definizione: Si presume che un processore XML stia svolgendo il suo compito sulla base di un altro modulo, chiamato l'applicazione.] Questa specifica descrive il comportamento richiesto a un processore XML nei termini di come esso debba leggere i dati XML e dell'informazione che esso deve fornire all'applicazione.

1.1 Origine e Obiettivi

XML Ã¨ stato sviluppato da un Gruppo di Lavoro per XML (in origine conosciuto come il Comitato di Revisione Editoriale {Editorial Review Board} di SGML) formato sotto l'egida del World Wide Web Consortium (W3C) nel 1996. È stato presieduto da Jon Bosak della Sun Microsystems con l'attiva partecipazione di un Gruppo di Interesse Speciale per XML {Special Interest Group} (conosciuto in precedenza come il Gruppo di Lavoro per SGML) anch'esso organizzato dal W3C. Le adesioni al Gruppo di Lavoro per XML vengono fornite in appendice. Dan Connolly ha svolto il ruolo di contatto fra il Gruppo di Lavoro e il W3C.

Gli obiettivi progettuali per XML sono:

XML dovrebbe essere utilizzabile direttamente su Internet.
XML dovrebbe supportare una vasta varietÃ di applicazioni.
XML dovrebbe essere compatibile con SGML.
Dovrebbe essere facile scrivere programmi che elaborano documenti XML.
Il numero di caratteristiche facoltative in XML deve mantenersi al minimo assoluto, idealmente a zero.
I documenti XML dovrebbero essere leggibili da esseri umani e ragionevolmente espliciti.
La progettazione di XML dovrebbe essere approntata rapidamente.
La progettazione di XML dovrebbe essere formale e concisa.
I documenti XML dovrebbero essere facili da creare.
Nella marcatura XML la concisione Ã¨ di importanza minima.

La presente specifica, insieme con gli standard ad essa associati (Unicode [Unicode] e ISO/IEC 10646 [ISO/IEC 10646] per i caratteri, Internet RFC 3066 [IETF RFC 3066] per i tag di identificazione della lingua, ISO 639 [ISO 639] per i codici dei nomi di lingua, e ISO 3166 [ISO 3166] per i codici dei nomi dei Paesi), fornisce tutte le informazioni necessarie alla comprensione di XML Versione 1.0 e alla costruzione di programmi per computer atti a elaborarlo.

Questa versione della specifica XML puÃ² essere distribuita gratuitamente, fintanto che tutto il testo e le note legali rimangono intatti.

1.2 Terminologia

La terminologia usata per descrivere i documenti XML viene definita nel corpo di questa specifica. Le parole chiave DEVE, non deve, Richiesto/obbligatorio, dovrÃ , non dovrÃ , dovrebbe, non dovrebbe, Raccomandato, ha facoltÃ /potrebbe, e facoltativo, quando Enfatizzate, sono da interpretarsi come descritto in [IETF RFC 2119]. In aggiunta, i termini definiti nel seguente elenco sono usati nella costruzione di quelle definizioni e nella descrizione delle azioni di un processore XML:

errore: [Definizione: Una violazione delle regole di questa specifica; le conseguenze sono indefinite. A meno che non sia diversamente specificato, la mancata osservazione di una prescrizione della presente specifica indicata da una delle parole chiave deve, Richiesto, non deve, dovrÃ e non dovrÃ Ã¨ un errore. Il software conforme ha facoltÃ di rilevare e riportare un errore e ha facoltÃ di prendere le contromisure per esso.]
errore fatale: [Definizione: Un errore che un processore XML deve rilevare e riportare all'applicazione. Dopo aver incontrato un errore fatale, il processore ha facoltÃ di continuare l'elaborazione dei dati per cercare ulteriori errori e ha facoltÃ di riportare tali errori all'applicazione. Nell'ottica di supportare la correzione degli errori, il processore ha facoltÃ di rendere disponibili i dati non elaborati dal documento (con dati carattere e marcatura frammisti) all'applicazione. Una volta che viene rilevato un errore fatale, comunque, il processore non deve continuare la normale elaborazione (ovvero, esso non deve continuare a passare all'applicazione nel modo consueto dati carattere e informazioni riguardo alla struttura logica del documento).]
a facoltÃ dell'utente: [Definizione: Il software conforme ha facoltÃ oppure deve (in dipendenza del verbo modale nella proposizione) comportarsi come descritto; se lo fa, esso deve fornire agli utenti i mezzi per abilitare o disabilitare il comportamento descritto.]
vincolo di validitÃ: [Definizione: Un regola che si applica a tutti i documenti XML validi. Le violazioni dei vincoli di validitÃ sono errori; essi devono, a facoltÃ dell'utente, essere segnalati dai processori che convalidano XML.]
vincolo di buona-formazione: [Definizione: Una regola che si applica a tutti i documenti XML ben-formati. Le violazioni dei vincoli di buona-formazione sono errori fatali.]
corrispondenza: [Definizione: (Di stringhe o nomi:) Due stringhe o nomi che vengono comparati devono essere identici. Caratteri con rappresentazioni multiple in ISO/IEC 10646 (ad es. caratteri sia con la forma pre-composta che con quella base+diacritica) corrispondono solo se hanno la stessa rappresentazione in entrambe le stringhe. Non viene attuata nessuna modifica dei caratteri maiuscoli e minuscoli. (Di stringhe e regole nella grammatica:) Una stringa corrisponde a un costrutto grammaticale se appartiene alla lingua generata da quel costrutto. (Di contenuto e modelli di contenuto:) Un elemento corrisponde alla sua dichiarazione quando Ã¨ conforme al modo descritto nel vincolo [VV: Elemento Valido].]
per compatibilitÃ: [Definizione: Marca una proposizione che descrive una caratteristica di XML inclusa solamente per assicurare che XML stesso rimanga compatibile con SGML.]
per interoperabilitÃ: [Definizione: Marca una proposizione che descrive una raccomandazione non vincolante inclusa per incrementare le possibilitÃ che i documenti XML possano essere elaborati dalla base esistente di processori SGML che precedono la WebSGML Adaptations Annex a ISO 8879.]

1.3 Motivazione ed elenco delle modifiche per XML 1.1

La Raccomandazione XML 1.0 del W3C Ã¨ stata rilasciata per la prima volta nel 1998, e a dispetto del rilascio di molti errata culminanti in una Terza Edizione del 2004, Ã¨ rimasta (intenzionalmente) immutata rispetto a cosa sia XML ben-formato e a cosa non lo sia. Questa stabilitÃ Ã¨ stata estremamente utile per l'interoperabilitÃ . A ogni modo, lo Standard Unicode sul quale poggia XML 1.0 per le specifiche di carattere non Ã¨ rimasto statico, evolvendo dalla versione 2.0 alla versione 4.0 e oltre. I caratteri non presenti in Unicode 2.0 potrebbero essere giÃ usati per i dati carattere di XML 1.0. In ogno caso, essi non sono permessi nei nomi XML come i nomi dei tipi di elemento, i nomi di attributo, i valori di attributo enumerati, gli obiettivi di istruzioni di processo, e cosÃ¬ via. In aggiunta, alcuni caratteri che avrebbero dovuti essere consentiti nei nomi XML non lo sono, a causa di sovrapposizioni e inconsistenze in Unicode 2.0.

La filosofia generale dei nomi Ã¨ mutata fin da XML 1.0. Dove XML 1.0 ha fornito una definizione rigida di nomi, per la quale tutto ciÃ² che non era permesso era proibito, i nomi XML 1.1 sono progettati in modo tale che tutto ciÃ² che non Ã¨ proibito (per una ragione specifica) Ã¨ consentito. Dal momento che Unicode continuerÃ a crescere dopo la versione 4.0, possono essere evitate ulteriori modifiche a XML permettendo quasi tutti i caratteri, inclusi quelli non ancora assegnati, nei nomi.

In aggiunta, XML 1.0 tenta di adattarsi alle convenzioni di fine-riga dei vari sistemi operativi moderni, ma discrimina le convenzioni usate su mainframe IBM e IBM-compatibili. Come risultato, i documenti XML sui mainframe non sono file di testo semplice in accordo con le convenzioni locali. I documenti XML 1.0 generati sui mainframe devono o violare le convenzioni locali di fine-riga, oppure impiegare fasi di traduzione altrimenti non necessarie prima di effettuare il parsing e dopo la generazione. Consentire un'interoperabilitÃ diretta Ã¨ particolarmente importante dove vengono condivisi i dati immagazzinati fra mainframe e sistemi non-mainframe (al contrario di quando vengono copiati da uno all'altro). PerciÃ² XML 1.1 aggiunge NEL (#x85) all'elenco dei caratteri di fine-riga. Per completezza, viene anche supportato il carattere separatore di riga, #x2028.

Infine, vi Ã¨ una considerevole richiesta per la definizione di una rappresentazione standard dei caratteri arbitrari Unicode nei documenti XML. PerciÃ², XML 1.1 permette l'uso di riferimenti di carattere ai caratteri di controllo da #x1 fino a #x1F, la maggior parte dei quali sono proibiti in XML 1.0. Per ragioni di robustezza, comunque, questi caratteri non possono ancora essere usati direttamente nei documenti. In vista di incrementare la robustezza del rilevamento della codifica di carattere, i caratteri di controllo aggiuntivi da #x7F fino a #x9F, i quali sono liberamente consentiti nei documenti XML 1.0, ora possono comaprire solo come riferimenti di carattere. (Naturalmente fanno eccezione i caratteri di spaziatura). Il sacrificio minore della compatibilitÃ all'indietro non viene considerato significativo. A causa dei problemi potenziali con le API, #x0 Ã¨ ancora proibito sia direttamente che come riferimento di carattere.

Infine XML 1.1 definisce un insieme di vincoli chiamato "completa normalizzazione" sui documenti XML, al quale i creatori di documento dovrebbero aderire, e che i processori di documento dovrebbero verificare. Usando documenti completamente normalizzati assicura che possano essere effettuate correttamente le comparazioni d'identitÃ per i nomi, i valori di attributo, e il contenuto di caratteri, con una semplice comparazione binaria delle stringhe Unicode.

È stata creata una nuova versione di XML, piuttosto che un insieme di errata a XML 1.0, perchÃ© le modifiche afferiscono alla definizione di documenti ben-formati. I processori XML 1.0 devono continuare a rifiutare documenti che contengano i nuovi caratteri nei nomi XML, le nuove convenzioni di fine-riga, e i riferimenti ai caratteri di controllo. La distinzione fra i documenti XML 1.0 e XML 1.1 viene indicata dall'informazione sul numero di versione nella dichiarazione XML all'inizio di ciascun documento.

2 Documenti

[Definizione: Un oggetto dati Ã¨ un documento XML se Ã¨ ben-formato, come definito in questa specifica. In aggiunta, il documento XML Ã¨ valido se rispetta certi altri vincoli.]

Ogni documento XML possiede sia una struttura logica che fisica. Fisicamente, il documento Ã¨ composto da unitÃ chiamate entitÃ . Un entitÃ ha facoltÃ di riferirsi ad altre entitÃ con lo scopo di ottenere la loro inclusione nel documento. un documento inizia in una "radice" {root} o entitÃ di documento. Logicamente, il documento Ã¨ composto di dichiarazioni, elementi, commenti, riferimenti di carattere, e istruzioni di processo, le quali sono tutte indicate nel documento da esplicita marcatura. Le strutture logiche e fisiche devono essere nidificate in maniera appropriata, come descritto in 4.3.2 EntitÃ Parsed Ben-Formate.

2.1 Documenti XML Ben-Formati

[Definizione: Un oggetto testuale Ã¨ un documento XML ben-formato se:]

Preso per intero, corrisponde alla produzione etichettata come documento.
Aderisce ai vincoli di buona-formazione forniti in questa specifica.
Ciascuna delle entitÃ parsed alla quale si fa riferimento direttamente o indirettamente all'interno del documento Ã¨ ben-formata.

Documento

Aderire alla produzione del documento implica che:

Contiene uno o piÃ¹ elementi.
[Definizione: Esiste esattamente un unico elemento, chiamato la radice {root}, o elemento del documento, del quale non compare nessuna parte nel contenuto di qualsiasi altro elemento.] Per tutti gli altri elementi, se il tag-di-inizio Ã¨ contenuto in un altro elemento, il tag-di-fine Ã¨ contenuto nello stesso elemento. Detto piÃ¹ semplicemente, gli elementi, delimitati da tag-di-inizio e -di-fine, vengono nidificati in maniera appropriata all'interno di ciascun altro.

[Definizione: Come conseguenza di ciÃ², per ciascun elemento C non-radice nel documento, esiste un altro elemento P nel documento tale che C Ã¨ il contenuto di P, ma non Ã¨ presente nel contenuto di qualsiasi altro elemento che Ã¨ presente nel contenuto di P. Ci si riferisce a P come il genitore {parent} di C, e a C come un figlio {child} di P.]

2.2 Caratteri

[Definizione: Un'entitÃ parsed contiene testo, un sequenza di caratteri, che possono rappresentare marcatura o dati carattere.] [Definizione: Un carattere Ã¨ un'unitÃ atomica di testo come specificato da ISO/IEC 10646:2000 [ISO/IEC 10646]. Caratteri ammessi sono tabulazioni, ritorni a capo, avanzamenti di riga, e i caratteri ammessi da Unicode e ISO/IEC 10646. Le versioni di questi standard citati in A.1 Riferimenti Normativi erano attuali al momento in cui questo documento Ã¨ stato preparato. Nuovi caratteri potrebbero essere stati aggiunti a questi standard da emendamenti o nuove edizioni. Di conseguenza, i processori XML devono accettare ogni carattere compreso negli intervalli specificati per Char. ]

Intervalli di Carattere

Il meccanismo per la codifica dei punti di codice in modelli binari potrebbe variare da entitÃ a entitÃ . Tutti i processori XML devono accettare le codifiche UTF-8 e UTF-16 di Unicode 3.1 [Unicode3]; i meccanismi per segnalare quale fra i due sia in uso, o per far entrare in gioco altre codifiche, vengono discusse piÃ¹ avanti, in 4.3.3 Codifica di Carattere nelle EntitÃ .

Nota:

Gli autori di documenti sono incoraggiati a evitare i "caratteri di compatibilitÃ ", come definiti nella sezione 6.8 di [Unicode] (si veda inoltre D21 nella sezione 3.6 di [Unicode3]). Anche i caratteri definiti negli intervalli seguenti non sono incoraggiati. Sono presenti sia caratteri di controllo che caratteri Unicode non definiti in maniera permanente:

[#x7F-#x84], [#x86-#x9F], [#xFDD0-#xFDDF],
[#x1FFFE-#x1FFFF], [#x2FFFE-#x2FFFF], [#x3FFFE-#x3FFFF],
[#x4FFFE-#x4FFFF], [#x5FFFE-#x5FFFF], [#x6FFFE-#x6FFFF],
[#x7FFFE-#x7FFFF], [#x8FFFE-#x8FFFF], [#x9FFFE-#x9FFFF],
[#xAFFFE-#xAFFFF], [#xBFFFE-#xBFFFF], [#xCFFFE-#xCFFFF],
[#xDFFFE-#xDFFFF], [#xEFFFE-#xEFFFF], [#xFFFFE-#xFFFFF],
[#x10FFFE-#x10FFFF].

2.3 Costrutti Sintattici Comuni

Questa sezione definisce alcuni simboli usati largamente nella grammatica.

S (spazio bianco) consiste in uno o piÃ¹ caratteri di spaziatura (#x20), ritorni a capo, avanzamenti di riga, o tabulazioni.

Spazio Bianco [3] S ::= (#x20 | #x9 | #xD | #xA)+

[Definizione: Un Name Ã¨ un token [N.d.T.: lemma] che inizia con una lettera o con uno dei pochi caratteri di punteggiatura, e prosegue con lettere, cifre, trattini, sottolineature, due punti o punti, conosciuti nell'insieme come caratteri di nome.] I nomi iniziano con la stringa "xml", o con qualsiasi stringa che corrisponda a (('X'|'x') ('M'|'m') ('L'|'l')), sono riservati alla standardizzazione in questa o in future versioni di questa specifica.

Nota:

L'Ambito dei Nomi {Namespace} nella Raccomandazione XML [Nomi XML] assegna un significato ai nomi contenenti i caratteri dei due punti. PerciÃ², gli autori non dovrebbero usare i due punti nei nomi XML eccetto che per scopi di ambito dei nomi, ma i processori XML devono accettare i due punti come un carattere di nome.

Un Nmtoken (token di nome) Ã¨ una qualsiasi combinazione di caratteri di nome.

Il primo carattere di un Name deve essere un NameStartChar, e qualsiasi altro carattere deve essere NameChars; questo meccanismo viene usato per prevenire che i nomi inizino con cifre europee (ASCII) o con caratteri combinanti di base. Sono consentiti quasi tutti i caratteri nei nomi, eccetto quelli che sono o potrebbero ragionevolmente essere usati come delimitatori. L'intenzione Ã¨ quella di essere includenti piuttosto che escludenti, cosicchÃ© i sistemi di scrittura non ancora codificato in Unicode possano essere utilizzati nei nomi XML. Vedi I Suggerimenti per i nomi XML per suggerimenti sulla creazione dei nomi.

Gli autori di documenti sono incoraggiati a usare nomi che siano parole o combinazioni di parole significative nei linguaggi naturali, e di evitare caratteri simbolici o di spaziatura nei nomi. Notare che DUE PUNTI {COLON}, TRATTINO {HYPHEN-MINUS}, PUNTO {FULL STOP}, TRATTINO BASSO {LOW LINE} (sottolineatura), e PUNTO MEDIO {MIDDLE DOT} sono esplicitamente permessi.

I simboli ASCII e i segni di punteggiatura, accanto a un buon gruppo di caratteri simbolo Unicode, sono esclusi dai nomi perchÃ© essi sono piÃ¹ utili come delimitatori in contesti dove i nomi XML sono usati al di fuori dei documenti XML; fornire questo gruppo dÃ a quei contesti garanzie forti su cosa non puÃ² far parte di un nome XML. Il carattere #x037E, PUNTO INTERROGATIVO GRECO {GREEK QUESTION MARK}, Ã¨ escluso perchÃ© quando viene normalizzato diventa un punto e virgola, cosa che potrebbe modificare il significato dei riferimenti di entitÃ .

Name e Token [4] NameStartChar ::=

":" | [A-Z] | "_" | [a-z] | [#xC0-#xD6] | [#xD8-#xF6] | [#xF8-#x2FF] | [#x370-#x37D] | [#x37F-#x1FFF] | [#x200C-#x200D] | [#x2070-#x218F] | [#x2C00-#x2FEF] | [#x3001-#xD7FF] | [#xF900-#xFDCF] | [#xFDF0-#xFFFD] | [#x10000-#xEFFFF]

[4a] NameChar ::= NameStartChar | "-" | "." | [0-9] | #xB7 | [#x0300-#x036F] | [#x203F-#x2040] [5] Name ::= NameStartChar (NameChar)* [6] Names ::= Name (#x20 Name)* [7] Nmtoken ::= (NameChar)+ [8] Nmtokens ::= Nmtoken (#x20 Nmtoken)*

Il dato letterale Ã¨ qualsiasi stringa virgolettata non contenente le virgolette usate come un delimitatore per quella stringa. I letterali vengono usati per specificare il contenuto di entitÃ interne (EntityValue), i valori degli attributi (AttValue), e gli identificatori esterni (SystemLiteral). Si noti che un SystemLiteral puÃ² essere analizzato in modo logico senza effettuare una scansione della marcatura.

Letterali

Nota:

Sebbene la produzione di EntityValue consenta la definizione di un'entitÃ generale consistente in un singolo esplicito < nel letterale (ad es., <!ENTITY mylt "<">), si consiglia fortemente di evitare questa pratica dal momento che ogni riferimento a quell'entitÃ causerÃ un errore di buona-formazione.

2.4 Dati carattere e Marcatura

Il testo consiste di dati carattere e marcatura frammisti. [Definizione: La marcatura prende la forma di tag-di-inizio, tag-di-fine, tag di elemento-vuoto, riferimenti di entitÃ , riferimenti di carattere, commenti, delimitatori di sezioni CDATA, dichiarazioni di tipo di documento, istruzioni di processo, dichiarazioni XML, dichiarazioni di testo, e qualsiasi spazio bianco che sia al livello massimo dell'entitÃ documento (cioÃ¨, fuori del elemento di documento e non all'interno di qualsiasi altra marcatura).]

[Definizione: Tutto il testo che non Ã¨ marcatura costituisce i dati carattere del documento.]

Il carattere di "e commerciale" (&) e la parentesi angolare sinistra (<) non devono apparire nella loro forma letterale, eccetto quando vengano usate come delimitatori di marcatura, o all'interno di un commento, di un'istruzione di processo, o di una sezione CDATA. Se si rendono necessari da qualche altra parte, essi devono esseri codificati in carattere escape usando sia i riferimenti numerici di carattere che rispettivamente le stringhe "&" e "<". La parentesi angolare destra (>) potrebbe essere rappresentata usando la stringa ">", e deve, per compatibilitÃ , essere codificata in caratteri escape usando sia ">" che un riferimento di carattere quando appare nel contenuto della stringa "]]>", quando quella stringa non sta marcando la fine di una sezione CDATA.

Nel contenuto di elementi, i dati carattere sono qualsiasi stringa di caratteri che non contiene il delimitatore iniziale di qualunque marcatura e non include il delimitatore di chiusura-sezione-CDATA, "]]>". In una sezione CDATA, i dati caratteri sono qualsiasi stringa di caratteri che non include il delimitatore di chiusura-sezione-CDATA, "]]>".

Per consentire ai valori di attributo di contenere sia le virgolette singole che doppie, l'apostrofo o il carattere di virgoletta singola (') potrebbero essere rappresentati come "'", e il carattere di doppie virgolette (") come """.

Dati Carattere [14] CharData ::= [^<&]* - ([^<&]* ']]>' [^<&]*) 2.6 Istruzioni di Processo

[Definizione: Le istruzioni di processo (le PI) permettono ai documenti di contenere istruzioni per le applicazioni.]

Istruzioni di Processo

Le PI non fanno parte dei dati carattere del documento, ma devono essere convogliate verso l'applicazione. La PI inizia con una destinazione (PITarget) usata per identificare l'applicazione alla quale Ã¨ diretta l'istruzione. I nomi di destinazione "XML", "xml", e cosÃ¬ via sono riservati per la standardizzazione in questa o in future versioni della presente specifica. Il meccanismo della Notazione XML potrebbe essere usato per la dichiarazione formale delle destinazioni delle PI. I riferimenti di entitÃ parametro non devono essere riconosciuti all'interno delle istruzioni di processo.

2.7 Sezioni CDATA

[Definizione: Le sezioni CDATA hanno facoltÃ di ricorrere ovunque possono ricorrere i dati carattere; sono usate per codificare blocchi di testo contenenti caratteri che altrimenti sarebbero stati riconosciuti come di marcatura. Le sezioni CDATA iniziano con la stringa "<![CDATA[" e finiscono con la stringa "]]>":]

Sezioni CDATA

All'interno di una sezione CDATA, solo la stringa CDEnd Ã¨ riconosciuta come marcatura, cosicchÃ© le parentesi angolari sinistre e le "e commerciali" potrebbero ricorrere nella loro forma letterale; esse non hanno bisogno (e non possono) essere codificate in caratteri escape usando "<" e "&". Le sezioni CDATA non possono essere nidificate.

Un esempio di sezione CDATA, nella quale "<greeting>" e "</greeting>" vengono riconosciuti come dati carattere, e non come marcatura:

<![CDATA[<greeting>Salve, mondo!</greeting>]]>

2.8 Prologo e Dichiarazione del Tipo di Documento

[Definizione: i documenti XML dovrebbero iniziare con una dichiarazione XML che specifichi la versione di XML che viene usata.] Per esempio, quello che segue Ã¨ un documento XML completo, ben-formato, ma non valido:

<?xml version="1.0"?>
<greeting>Salve, mondo!</greeting>

e cosÃ¬ anche questo:

<greeting>Salve, mondo!</greeting>

La funzione della marcatura in un documento XML Ã¨ di descrivere la sua allocazione e struttura logica e associare le coppie nome-valore con le sue strutture logiche. XML fornisce un meccanismo, la dichiarazione del tipo di document o, per definire vincoli sulla struttura logica e supportare l'uso di unitÃ di allocazione predefinite. [Definizione: Un documento XML Ã¨ valido se ha una dichiarazione di tipo di documento associata e se il documento rispetta i vincoli in esso espressi.]

La dichiarazione del tipo di documento deve apparire precedentemente al primo elemento nel documento.

Prologo

[Definizione: La dichiarazione di tipo di documento XML contiene o punta a dichiarazioni di marcatura che forniscono una grammatica per una classe di documenti. Questa grammatica Ã¨ conosciuta come definizione del tipo di documento, o DTD. La dichiarazione del tipo di documento puÃ² puntare a un sotto-insieme esterno (un tipo speciale di entitÃ esterna) contenente dichiarazioni di marcatura, o puÃ² contenere dichiarazioni di marcatura direttamente in un sotto-insieme interno, oppure entrambe le cose. La DTD per un documento consiste di entrambi i sotto-insieme presi insieme.]

[Definizione: Una dichiarazione di marcatura Ã¨ una dichiarazione del tipo di elemento, una dichiarazione dell'elenco-attributo, una dichiarazione di entitÃ , o una dichiarazione di notazione.] Queste dichiarazioni potrebbero essere contenute per intero o in parte all'interno di entitÃ di parametro, come descritto nei sottostanti vincoli di buona-formazione e validitÃ . Per ulteriori informazioni, si veda 4 Strutture Fisiche.

Definizione del Tipo di Documento

Si noti che Ã¨ possibile costruire un documento ben-formato contenente un doctypedecl che non punti nÃ© a un sotto-insieme esterno nÃ© contenga un sotto-insieme interno.

Le dichiarazioni di marcatura potrebbero essere costruite in tutto o in parte da testo in sostituzione di entitÃ di parametro. Le produzioni successive in questa specifica per non-terminali individuali (elementdecl, AttlistDecl, e cosÃ¬ via) descrivono le dichiarazioni dopo che tutte le entitÃ di parametro sono state incluse.

I riferimenti di entitÃ di parametro vengono riconosciute ovunque nella DTD (sotto-insiemi interni ed esterni ed entitÃ di parametro), eccetto nei letterali, istruzioni di processo, commenti, e i contenuti di sezioni condizionali ignorate (vedi 3.4 Sezioni Condizionali). Essi vengono inoltre riconosciuti in letterali di valore d'entitÃ . L'uso di entitÃ di parametro nel sotto-insieme interno Ã¨ ristretto nel modo descritto sotto.

Come un sotto-insieme interno, il sotto-insieme esterno e ogni entitÃ parametro esterna referenziata in un DeclSep deve consistere in una serie di dichiarazioni di marcatura complete dei tipi permessi dal simbolo non-terminale markupdecl, intervallati con spazio bianco o riferimenti di entitÃ -parametro. Comunque, porzioni dei contenuti del sotto-insieme esterno o di queste entitÃ parametro esterne potrebbero in modo condizionale essere ignorate usando il costrutto di sezione condizionale; ciÃ² non Ã¨ permesso nel sotto-insieme interno, ma Ã¨ permesso nelle entitÃ parametro esterne referenziate nel sotto-insieme interno.

Sotto-insieme Esterno

Anche il sotto-insieme esterno e le entitÃ parametro esterne differiscono dal sotto-insieme interno, nel fatto che in loro, i riferimenti a entitÃ -parametro sono permessi all'interno delle dichiarazioni di marcatura, non solo fra le dichiarazioni di marcatura.

Un esempio di un documento XML con una dichiarazione di tipo di documento:

<?xml version="1.0"?>
<!DOCTYPE greeting SYSTEM "hello.dtd">
<greeting>Salve, mondo!</greeting>

L'identificatore di sistema "hello.dtd" fornisce l'indirizzo (un riferimento URI) di una DTD per il documento.

Le dichiarazioni possono anche essere fornite localmente, come in questo esempio:

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE greeting [
  <!ELEMENT greeting (#PCDATA)>
]>
<greeting>Salve, mondo!</greeting>

Se vengono usati sia i sotto-insiemi interni che esterni, il sotto-insieme interno deve essere considerato ricorrente prima del sotto-insieme esterno. Questo ha l'effetto di dare la precedenza alle dichiarazioni di entitÃ e di elenco-attributo nel sotto-insieme interno rispetto a quelle nel sotto-insieme esterno.

XML 1.1 processors SHOULD accept XML 1.0 documents as well. If a document is well-formed or valid XML 1.0, and provided it does not contain any control characters in the range [#x7F-#x9F] other than as character escapes, it may be made well-formed or valid XML 1.1 respectively simply by changing the version number.

2.9 Dichiarazione di Documento Autonomo

Le dichiarazioni di marcatura possono influire sul contenuto del documento, quando passate da un processore XML a un'applicazione; esempi sono i valori predefiniti di attributo e le dichiarazioni di entitÃ . La dichiarazione di documento autonomo {standalone}, che ha facoltÃ di comparire come un componente della dichiarazione XML, segnala se esistono o no tali dichiarazioni che compaiono esterne all'entitÃ documento o nelle entitÃ parametro. [Definizione: Una dichiarazione esterna di marcatura viene definita come una dichiarazione di marcatura che ricorre in un sotto-insieme esterno o in un'entitÃ parametro (esterna o interna, quest'ultima viene inclusa perchÃ© i processori non-validanti non sono tenuti a leggerle).]

Dichiarazione di Documento Autonomo

In una dichiarazione di documento autonomo, il valore "yes" indica che non esistono dichiarazioni esterne di marcatura che riguardano l'informazione passata dal processore XML all'applicazione. Il valore "no" indica che esistono o potrebbero esistere tali dichiarazioni esterne di marcatura. Si noti che la dichiarazione di documento autonomo denota solo la presenza di dichiarazioni esterne; la presenza, in un documento, di riferimenti a entitÃ esterne, quando queste entitÃ sono dichiarate internamente, non modifica il suo status di autonomia.

Se non esistono dichiarazioni esterne di marcatura, la dichiarazione di documento autonomo non ha significato. Se esistono dichiarazioni esterne di marcatura ma non esiste una dichiarazione di documento autonomo, viene presunto il valore "no".

Ogni documento XML per il quale valga standalone="no" puÃ² essere convertito in modo algoritmico in un documento autonomo, cosa che potrebbe essere desiderabile per alcune applicazioni di trasporto di rete.

Vincolo di validitÃ : Dichiarazione di Documento Autonomo

La dichiarazione di documento autonomo deve assumere il valore "no" se qualsiasi dichiarazione esterna di marcatura contenga dichiarazioni di:

attributi con valori predefiniti, se gli elementi ai quali si applicano questi attributi compaiano nel documento senza specificazioni di valori per questi attributi, oppure di
entitÃ (diverse da amp, lt, gt, apos, quot), se i riferimenti a quelle entitÃ compaiano nel documento, oppure di
attributi con i tipi resi come token, dove l'attributo compare nel documento con un valore tale che la normalizzazione produrrÃ un valore differente da quello che avrebbe prodotto in assenza della dichiarazione, oppure di
tipi di elemento con contenuto di elemento, se ricorre dello spazio bianco direttamente all'interno di ciascuna istanza di quei tipi.

Un esempio di dichiarazione XML con una dichiarazione di documento autonomo:

<?xml version="1.1" standalone='yes'?>

2.10 Gestione dello Spazio Bianco

Nella manipolazione di documenti XML, spesso Ã¨ conveniente usare lo "spazio bianco" (spaziature, tabulazioni, e righe bianche) per dividere la marcatura a favore di una maggiore leggibilitÃ . Tale spazio bianco tipicamente non viene incluso nella versione definitiva del documento. D'altro canto, Ã¨ comune la presenza di spazio bianco "significativo" che dovrebbe essere preservato nella versione definitiva, per esempio in poesia e in codice sorgente.

Un processore XML deve sempre passare tutti i caratteri di un documento che non sono marcatura verso l'applicazione. Un processore XML validante inoltre deve informare l'applicazione di quali di questi caratteri costituisce lo spazio bianco che compare nel contenuto dell'elemento.

Uno speciale attributo di nome xml:space potrebbe essere allegato a un elemento per segnalare l'intenzione che in quell'elemento, lo spazio bianco dovrebbe essere preservato dalle applicazioni. Nei documenti validi, questo attributo, come ogni altro, deve essere dichiarato se viene usato. Quando dichiarato, deve essere fornito come un tipo enumerato i valori del quale sono uno o entrambi quelli di "default" e "preserve". Per esempio:

<!ATTLIST poem  xml:space (default|preserve) 'preserve'>

<!ATTLIST pre xml:space (preserve) #FIXED 'preserve'>

Il valore "default" segnala che le modalitÃ predefinite per elaborare lo spazio bianco da parte delle applicazioni sono accettabili per questo elemento; il valore "preserve" indica che la volontÃ che le applicazioni preservino tutto lo spazio bianco. Questo intento dichiarato si considera da doversi applicare a tutti gli elementi all'interno del contenuto dell'elemento dove viene specificato, a meno che sovrascritto con un'altra istanza dell'attributo xml:space. Questa specifica non dÃ altro significato a qualsiasi valore di xml:space diverso da "default" e "preserve". È un errore se vengono specificati altri valori; il processore XML ha facoltÃ di riportare l'errore oppure ha facoltÃ di recuperarlo ignorando la specificazione dell'attributo o riportando il valore (erroneo) all'applicazione. Le applicazioni hanno facoltÃ di ignorare o rigettare valori erronei.

L'elemento radice di ciascun documento viene considerato come non abbia segnalato alcuna intenzione riguardo alla gestione dello spazio bianco da parte dell'applicazione, a meno che fornisca un valore per questo attributo o l'attributo sia dichiarato con un valore predefinito.

2.11 Gestione del Fine-Riga

Le entitÃ parsed di XML spesso sono conservate in file di computer i quali, per convenienza di manipolazione, sono organizzate in linee. Queste linee tipicamente sono separate da una qualche combinazione dei caratteri RITORNO A CAPO {CARRIAGE RETURN} (#xD) e AVANZAMENTO DI RIGA {LINE FEED} (#xA).

Per semplificare i compiti delle applicazioni, il processore XML deve comportarsi come se avesse normalizzato tutte le interruzioni di riga in entitÃ esterne parsed (inclusa l'entitÃ documento) in ingresso, prima del parsing, traducendo tutti quelli che seguono, in un singolo carattere #xA:

la sequenza di due caratteri #xD #xA
la sequenza di due caratteri #xD #x85
il carattere singolo #x85
il carattere singolo #x2028
ogni carattere #xD che non sia seguito immediatamente da #xA o #x85.

I caratteri #x85 e #x2028 non possono essere riconosciuti e tradotti in modocannot be reliably recognized and translated until an entity's encoding declaration (if present) has been read. Therefore, it is a fatal error to use them within the XML declaration or text declaration.

2.12 Identificazione della Lingua

Nell'elaborare il documento, spesso Ã¨ utile identificare il linguaggio naturale o formale nel quale Ã¨ scritto il contenuto. Uno speciale attributo di nome xml:lang potrebbe essere inserito nei documenti per specificare la lingua usata nei contenuti e nei valori di attributo di ogni elemento nel documento XML. Nei documenti validi, questo attributo, come ogni altro, deve essere dichiarato se viene usato. I valori dell'attributo sono gli identificatori di lingua come definiti da [IETF RFC 3066], Etichette per l'Identificazione delle Lingue, o sue successive; in aggiunta, potrebbe specificarsi la stringa vuota.

(Le produzioni da 33 a 38 sono state rimosse.)

Per esempio:

<p xml:lang="en">The quick brown fox jumps over the lazy dog.</p>
<p xml:lang="en-GB">What colour is it?</p>
<p xml:lang="en-US">What color is it?</p>
<sp who="Faust" desc='leise' xml:lang="de">
<l>Habe nun, ach! Philosophie,</l>
<l>Juristerei, und Medizin</l>
<l>und leider auch Theologie</l>
<l>durchaus studiert mit hei&#xDF;em Bem&#xFC;h'n.</l>
</sp>

La lingua specificata con xml:lang si applica all'elemento dove sia specificato (inclusi i valori dei suoi attributi) e a tutti gli elementi del suo contenuto, a meno che non venga annullato da un'altra istanza di xml:lang. In particolare, il valore vuoto di xml:lang viene usato su un elemento B per sovrascrivere una specificazione di xml:lang nell'elemento A che lo racchiude, senza specificare un'altra lingua. All'interno di B, si considera che non c'Ã¨ disponibile un'informazione sulla lingua, proprio come se xml:lang non fosse stato specificato su B o su ciascuno dei suoi avi. Le applicazioni determinano quale fra i valori di attributo di un elemento e quali parti del suo contenuto di caratteri, se presenti, vengano trattati come valori dipendenti dalla lingua descritta da xml:lang.

Nota:

L'informazione sulla lingua puÃ² anche essere fornita da protocolli esterni di trasporto (ad es. HTTP o MIME). Quando disponibile, questa informazione potrebbe essere usata da applicazioni XML, ma dovrebbe considerarsi che l'informazione piÃ¹ locale fornita da xml:lang la reimposti.

Una semplice dichiarazione per xml:lang potrebbe prendere la forma

ma potrebbero anche essere dati valori specifici predefiniti, se appropriati. In una raccolta di poemi francesi per studenti inglesi, con glosse e note in inglese, l'attributo xml:lang potrebbe essere dichiarato in questo modo:

<!ATTLIST poem   xml:lang CDATA 'fr'>
<!ATTLIST gloss  xml:lang CDATA 'en'>
<!ATTLIST note   xml:lang CDATA 'en'>

2.13 Controllo della Normalizzazione

Tutte le entitÃ parsed di XML (incluse le entitÃ documento) dovrebbero essere completamente normalizzate in base alla definizione di B Definizioni per la Normalizzazione del Carattere con il supplemento delle seguenti definizioni di costrutti rilevanti per XML:

Il testo sostitutivo di tutte le entitÃ parsed
Tutto il testo che corrisponda, nel contesto, a uno delle seguenti produzioni:
1. CData
2. CharData
3. content
4. Name
5. Nmtoken

In ogni caso, un documento Ã¨ ancora ben-formato per quanto non sia completamente normalizzato. I processori XML dovrebbero fornire all'utente la facoltÃ di verificare che il documento che Ã¨ stato elaborato sia in una forma completamente normalizzata, e riportare all'applicazione se esso lo sia o non. La possibilitÃ di non verificare dovrebbe essere scelta solo quando il testo in ingresso Ã¨ certificato, come definito da B Definizioni per la Normalizzazione del Carattere.

La verifica della completa normalizzazione deve essere portata a termine come se per prima cosa verificando che l'entitÃ sia in forma inclusa-normalizzata come definito da B Definizioni per la Normalizzazione del Carattere e dopo verificando che nessuno dei costrutti rilevati sopra elencati cominci (dopo che i riferimenti di carattere siano stati esansi) con un carattere componente come definito da B Definizioni per la Normalizzazione del Carattere. I processori non-validanti devono ignorare possibili denormalizzazioni che sarebbero state causate dall'inclusione di entitÃ esterne che essi non leggono.

Nota:

I caratteri componenti sono tutti i caratteri Unicode di classe combinante non-zero, piÃ¹ un piccolo numero di caratteri di classe-zero i quali non di meno prendono parte come un carattere non-iniziale in certe decomposizioni canoniche di Unicode. Dal momento che ci si aspetta che questi caratteri seguano i caratteri di base, impedire ai costrutti rilevanti (incluso il contenuto) dal cominciare con un carattere componente non diminuisce in modo significativo l'espressivitÃ di XML.

Se, mentre si verifica la completa normalizzazione, un processore incontra caratteri per i quali non puÃ² determinare le proprietÃ di normalizzazione (ovvero, i cartteri introdotti in una versione di Unicode [Unicode] successiva a quella utilizzata nell'implementazione del processore), allora il processore potrebbe, a facoltÃ dell'utente, ignorare ogni possibile denormalizzazione causata da questi caratteri. La facoltÃ di ignorare queste denormalizzazioni non dovrebbe essere offerta dalle applicazioni quando l'affidabilitÃ o la sicurezza siano critiche.

I processori XML non devono trasformare i dati in ingresso che devono essere in forma completamente normalizzata. Le applicazioni che creano dati in uscita XML 1.1 da un ingresso sia XML 1.1 che XML 1.0 dovrebbero assicurare che i dati in uscita siano completamente normalizzati; non Ã¨ necessario che le forme di elaborazione interna siano completamente normalizzate.

Lo scopo di questa sezione Ã¨ di incoraggiare fortemente i processori XML ad assicurare che i creatori di documenti XML li abbiano normalizzati in maniera appropriata, cosicchÃ© le applicazioni XML possano effettuare delle prove, come le comparazioni di identitÃ delle stringhe, senza preoccuparsi delle possibili differenti "ortografie" delle stringhe che Unicode permette.

Quando le entitÃ sono in una codifica non-Unicode, se il processore li transcodifica in Unicode, dovrebbe usare una transcodificatore che opera la normalizzazione.

3 Strutture logiche

[Definizione: Ogni documento XML contiene uno o piÃ¹ elementi, i limiti dei quali sono delimitati sia da tag-di-inizio e tag-di-fine, che, per elementi vuoti, da un tag di elemento-vuoto. Ogni elemento ha un tipo, identificato da un nome, a volte chiamato il suo "identificatore generico" {generic identifier} (GI), e potrebbe avere un insieme di specificazioni d'attributo.] Ogni specificazione d'attributo ha un nome e un valore.

Elemento

Questa specifica non vincola la semantica, l'uso, o (al di lÃ della sintassi) i nomi dei tipi di elemento e degli attributi, eccetto che per quei nomi che iniziano con una corrispondenza a (('X'|'x')('M'|'m')('L'|'l')) i quali sono riservati alla standardizzazione in questa o in future versioni della presente specifica.

Vincolo di ValiditÃ : Elemento Valido

Un elemento Ã¨ valido se esiste una dichiarazione corrispondente a elementdecl dove il Name corrisponde al tipo di elemento, ed Ã¨ valida una delle seguenti:

La dichiarazione corrisponde a EMPTY e l'elemento non ha contenuto (nemmeno riferimenti di entitÃ , commenti, PI o spazio bianco).
La dichiarazione corrisponde a figli e la sequenza degli elementi figli appartiene al linguaggio generato dall'espressione regolare nel modello di contenuto, con spazio bianco, commenti e PI facoltativi (ovvero marcatura corrispondente a produzione [27] Misc) fra il tag-di-inizio e il primo elemento figlio, fra elementi figli, o fra l'ultimo elemento figlio e il tag-di-fine. Si noti che una sezione CDATA contenente un solo spazio bianco o un riferimento a un'entitÃ il testo sostitutivo della quale Ã¨ uguale a riferimenti di carattere convertibili in spazio bianco, non corrisponde a S non-terminale, e quindi non puÃ² comparire in queste posizioni; comunque, un riferimento a un'entitÃ interna con un valore letterale consistente di riferimenti di carattere convertibili in spazio bianco non corrisponde a S, dal momento che il suo testo sostitutivo Ã¨ spazio bianco risultante dalla conversione dei riferimenti di carattere.
La dichiarazione corrisponde a Misto, e il contenuto (dopo aver rimpiazzato ogni riferimento di entitÃ con il suo testo sostitutivo) consiste di dati carattere (incluse le sezioni CDATA), commenti, PI e elementi figli i cui tipi corrispondono ai nomi nel modello di contenuto.
La dichiarazione corrisponde a ANY, e il contenuto (dopo aver rimpiazzato ogni riferimento di entitÃ con il suo testo sostitutivo) consiste di dati carattere, sezioni CDATA, commenti, PI, ed elementi figli i cui tipi sono stati dichiarati.

3.1 Tag-di-Inizio, Tag-di-Fine, e Tag di Elemento-Vuoto

[Definizione: L'inizio di ogni elemento XML non-vuoto Ã¨ marcato da un tag-di-inizio.]

Tag-di-inizio

Il Name nei tag-di-inizio e -di-fine fornisce il tipo dell'elemento. [Definizione: Ci si riferisce alle coppie Name-AttValue come le aspecificazioni d'attributo dell'elemento], [Definizione: in ogni coppia, con il Name ci si riferisce al nome dell'attributo] e [Definizione: con il contenuto di AttValue (il testo fra i delimitatori ' o ") al valore dell'attributo.] Si noti che l'ordine delle specificazioni d'attributo in un tag-di-inizio o in un tag di elemento-vuoto non Ã¨ significativo.

Un esempio di tag-di-inizio:

<termdef id="dt-dog" term="dog">

[Definizione: La fine di ogni elemento che comincia con un tag-di-inizio deve essere marcata da un tag-di-fine contenente un nome che ricalchi il tipo d'elemento cosÃ¬ come dato nel tag-di-inizio:] Tag-di-fine

Un esempio di tag-di-fine:

[Definizione: Il testo fra il tag-di-inizio e il tag-di-fine viene chiamato il contenuto dell'elemento:] Contenuto degli Elementi

[Definizione: Un elemento con nessun contenuto si dice essere vuoto.] La rappresentazione di un elemento vuoto Ã¨ sia un tag-di-inizio immediatamente seguito da un tag-di-fine, che da un tag di elemento-vuoto. [Definizione: Un tag di elemento-vuoto prende una forma speciale:]

Tag per Elementi Vuoti

I tag di elemento-vuoto hanno facoltÃ di essere usati per qualsiasi elemento che non abbia contenuto, sia se Ã¨ o non Ã¨ dichiarato, usando la parola chiave EMPTY. Per interoperabilitÃ , il tag di elemento-vuoto dovrebbe essere usato, e dovrebbe solo essere usato, per elementi che sono dichiarati EMPTY.

Esempi di elementi vuoti:

<IMG align="left"
src="http://www.w3.org/Icons/WWW/w3c_home" />
<br></br>
<br/>

3.2 Dichiarazioni del Tipo di Elemento

La struttura di elemento di un documento XML potrebbe, per scopi di convalida, essere vincolata usando dichiarazioni del tipo di elemento e elenco-attributo. Una dichiarazione del tipo di elemento vincola il contenuto dell'elemento.

Le dichiarazioni del tipo di elemento spesso vincolano quali tipi di elemento possano comparire come figli dell'elemento. A facoltÃ dell'utente, un processore XML potrebbe sottomettere un avvertimento quando una dichiarazione menzioni un tipo di elemento per il quale non sia stata fornita alcuna dichiarazione, ma questo non Ã¨ un errore.

[Definizione: Una dichiarazione del tipo di elemento prende la forma:]

Dichiarazione del Tipo di Elemento

dove il Name fornisce il tipo di elemento da dichiararsi.

Vincolo di ValiditÃ : Dichiarazione Unica del Tipo di Elemento

Un tipo di elemento non deve essere dichiarato piÃ¹ di una volta.

Esempi di dichiarazioni del tipo di elemento:

<!ELEMENT br EMPTY>
<!ELEMENT p (#PCDATA|emph)* >
<!ELEMENT %name.para; %content.para; >
<!ELEMENT container ANY>

3.2.1 Contenuto dell'Elemento

[Definizione: Un tipo di elemento possiede un contenuto di elemento quando gli elementi di quel tipo devono contenere solo gli elementi figli (nessun dato carattere), facoltativamente separato da spazio bianco (caratteri corrispondenti alla S non-terminale).] [Definizione: In questo caso, il vincolo include un modello di contenuto, una semplice grammatica che governi i tipi ammessi degli elementi figli e l'ordine nel quale a essi Ã¨ consentito di comparire.] La grammatica Ã¨ costruita sulle particelle di contenuto (le cp {particles content}), che consistono in nomi, in elenchi di scelte di particelle di contenuto, o in elenchi di sequenze di particelle di contenuto:

Modelli di contenuto d'elemento

dove ogni Name Ã¨ il tipo di un elemento che ha facoltÃ di comparire come un figlio. Ogni particella di contenuto in un elenco di scelte ha facoltÃ di comparire nel contenuto dell'elemento nel posto dove compare l'elenco di scelte nella grammatica; particelle di contenuto che ricorrono in un elenco di sequenze devono comparire ciascuna nel contenuto dell'elemento nell'ordine dato dall'elenco. Il carattere facoltativo che segue un nome o un elenco stabilisce se gli elementi o le particelle di contenuto nell'elenco possano ricorrere una o piÃ¹ volte (+), zero o piÃ¹ volte (*), oppure zero o una volta (?). L'assenza di tale operatore significa che l'elemento o la particella di contenuto devono comparire esattamente una volta sola. Questa sintassi e il significato sono identici a quelli usati nelle produzioni di questa specifica.

Il contenuto di un elemento corrisponde al modello di contenuto se e solo se Ã¨ possibile rintracciare un percorso attraverso il modello di contenuto, obbedendo alla sequenza, alla scelta, e agli operatori di ripetizione ed effettuando la corrispondenza di ogni elemento nel contenuto con un tipo di elemento nel modello di contenuto. Per compatibilitÃ , Ã¨ un errore se il modello di contenuto permette a un elemento di corrispondere con piÃ¹ di un'occorrenza di un tipo di elemento nel modello di contenuto. Per maggiori informazioni, si veda E Modelli Deterministici di Contenuto.

Vincolo di ValiditÃ : Nidificazione Appropriata di Gruppo/PE

Il testo sostitutivo di entitÃ -parametro deve essere appropriatamente nidificato con gruppi parentesificati. Vale a dire, se la parentesi sia di apertura che di chiusura in un costrutto choice, seq, o Mixed Ã¨ contenuta in un testo sostitutivo per un'entitÃ di parametro, entrambe devono essere contenute nello stesso testo sostitutivo.

Per interoperabilitÃ , se un riferimento a entitÃ -parametro compare in un costrutto choice, seq, o Mixed, il suo testo sostitutivo dovrebbe contenere almeno un carattere non-bianco, e nÃ© il primo nÃ© l'ultimo carattere non-bianco del testo sostitutivo dovrebbe essere un connettore (| oppure ,).

Esempi di modelli di contenuto d'elemento:

<!ELEMENT spec (front, body, back?)>
<!ELEMENT div1 (head, (p | list | note)*, div2*)>
<!ELEMENT dictionary-body (%div.mix; | %dict.mix;)*>

3.3 Dichiarazioni di Elenco-Attributo

Gli attributi vengono usati per associare le coppie nome-valore con gli elementi. Le specificazioni di attributo non devono comparire al di fuori dei tag-di-inizio e dei tag di elemento-vuoto; cosÃ¬, le produzioni usate per riconoscerli compaiono in 3.1 Tag-di-Inizio, Tag-di-Fine, e Tag di Elemento-Vuoto. Le dichiarazioni di elenco-attributo hanno facoltÃ di essere usate:

Per definire l'insieme degli attributi pertinenti a un dato tipo di elemento.
Per stabilire i vincoli di tipo per questi attributi.
Per fornire valori predefiniti per gli attributi.

[Definizione: Dichiarazioni di elenco-attributo specificano il nome, il tipo di dato, e il valore predefinito (se esiste) di ciascun attributo associato con un dato tipo di elemento:]

Dichiarazione di elenco-attributo

Il Name nella regola AttlistDecl Ã¨ il tipo di un elemento. A facoltÃ dell'utnete, un processore XML potrebbe sottomettere un avvertimento se gli attributi sono dichiarati per un tipo di elemento esso stesso non dichiarato, ma questo non Ã¨ un errore. Il Name nella regola AttDef Ã¨ il nome dell'attributo.

Quando viene fornito piÃ¹ di un AttlistDecl per un dato tipo di elemento, i contenuti di tutti quelli forniti vengono uniti. Quando viene fornita piÃ¹ di una definizione per lo stesso attributo di un dato tipo di elemento, la prima dichiarazione Ã¨ vincolante e le altre vengono ignorate. Per interoperabilitÃ , chi scrive le DTD ha facoltÃ di scegliere di fornire al massimo una sola dichiarazione di elenco-attributo per un dato tipo di elemento, al massimo una sola definizione di attributo per un dato nome di attributo in una dichiarazione di elenco-attributo, e almento una singola definizione di attributo in ogni dichiarazione di elenco-attributo. Per interoperabilitÃ , un processore XML potrebbe a facoltÃ dell'utente sottomettere un avvertimento quando viene fornita piÃ¹ di una dichiarazione di elenco-attributo per un dato tipo di elemento, oppure quando viene fornita piÃ¹ di una definizione di attributo per un dato attributo, ma questo non Ã¨ un errore.

3.3.3 Normalizzazione del Valore di Attributo

Prima che il valore di un attributo sia passato all'applicazione o verificato nella validitÃ , il processore XML deve normalizzare il valore di attributo applicando l'algoritmo sottostante, oppure usando qualche altro metodo tale che il valore passato all'applicazione sia lo stesso di quello prodotto dall'algoritmo.

Tutte le interruzioni di riga devono essere state normalizzate in ingresso con #xA come descritto in 2.11 Gestione del Fine-Riga, cosicchÃ© il resto di questo algoritmo opera su testo normalizzato in questo modo.
Comincia con un valore normalizzato consistente nella stringa vuota.
Per ogni carattere, riferimento di entitÃ , o riferimento di carattere nel valore di attributo non normalizzato, a cominciare dal primo e continuando fino all'ultimo, eseguire ciÃ² che segue:
- Per un riferimento di carattere, aggiungere il carattere referenziato al valore normalizzato.
- Per un riferimento di entitÃ , applicare ricorsivamente il passo 3 di questo algoritmo al testo sostitutivo dell'entitÃ .
- Per un carattere di spazio bianco (#x20, #xD, #xA, #x9), aggiungere un carattere di spaziatura (#x20) al valore normalizzato.
- Per altro carattere, aggiungere il carattere al valore normalizzato.

Se il tipo di attributo non Ã¨ CDATA, allora il processore XML deve elaborare ulteriormente il valore di attributo normalizzato scartando tutti i caratteri di spaziatura (#x20) in testa e in coda, e sostituendo le sequenze di spaziatura (#x20) con una singola spaziatura (#x20).

Si noti che se il valore di attributo non normalizzato contiene un riferimento di carattere a un carattere di spazio bianco diverso dalla spaziatura (#x20), il valore normalizzato contiene il carattere referenziato stesso (#xD, #xA or #x9). CiÃ² Ã¨ in contrasto con il caso in cui il valore non normalizzato contenga un carattere di spazio bianco (non un riferimento), il quale Ã¨ sostituito con una spaziatura (#x20) nel valore normalizzato ed Ã¨ anche in contrasto con il caso di un riferimento di entitÃ , il testo sostitutivo del quale contenga un carattere di spazio bianco; essendo elaborato in maniera ricorsiva, il carattere di spazio bianco Ã¨ sostituito con una spaziatura (#x20) nel valore normalizzato.

Tutti gli attributi per i quali non Ã¨ stata letta alcuna dichiarazione dovrebbero essere trattati da un processore non-validante come se fossero CDATA dichiarati.

Ã un errore se un valore di attributo contiene un riferimento a un'entitÃ per la quale non Ã¨ stata letta alcuna dichiarazione.

Appresso vengono degli esempi di normalizzazione di attributo. Date le seguenti dichiarazioni:

<!ENTITY d "&#xD;">
<!ENTITY a "&#xA;">
<!ENTITY da "&#xD;&#xA;">

le specificazioni di attributo nella colonna sinistra sottostante sarebbero normalizzate con le sequenze di carattere della colonna centrale se l'attributo a viene dichiarato NMTOKENS e con quelli della colonna destra se a viene dichiarato CDATA. Specificazione di attributo a Ã¨ NMTOKENS a Ã¨ CDATA a=" xyz" x y z #x20 #x20 x y z a="&d;&d;A&a; &a;B&da;" A #x20 B #x20 #x20 A #x20 #x20 #x20 B #x20 #x20 a= "A

B
" #xD #xD A #xA #xA B #xD #xA #xD #xD A #xA #xA B #xD #xA Si noti che l'ultimo esempio non Ã¨ valido (ma ben-formato) se a viene dichiarato essere di tipo NMTOKENS. 3.4 Sezioni Condizionali

[Definizione: Le sezioni condizionali sono porzioni del sotto-insieme esterno della dichiarazione del tipo di documento o di entitÃ di parametro esterne che sono incluse nella, o escluse dalla, struttura logica della DTD in base alla parola chiave che le governa.]

Sezione Condizionale

Come i sotto-insiemi di DTD interni ed esterni, un sezione condizionale potrebbe contenere una o piÃ¹ dichiarazioni complete, commenti, istruzioni di processo, o sezioni condizionali nidificate, inframmezzate da spazio bianco.

Qualora la parola chiave della sezione condizionale sia INCLUDE, allora i contenuti della sezione condizionale devono essere considerati parte della DTD. Qualora la parola chiave della sezione condizionale sia IGNORE, allora i contenuti della sezione condizionale devono essere considerati come non facenti parte in modo logico della DTD. Qualora ricorra una sezione condizionale con una parola chiave INCLUDE all'interno di una sezione condizionale piÃ¹ ampia con la parola chiave IGNORE, sia le sezioni condizionali piÃ¹ esterne che quelle piÃ¹ interne devono essere ignorate. I contenuti di una sezione condizionale ignorata devono essere analizzati in modo logico ignorando tutti i caratteri dopo la "[" che segue la parola chiave, eccetto qualora la sezione condizionale inizi con "<![" e finisca con "]]>", finchÃ© non viene trovata la corrispondente fine di sezione condizionale. I riferimenti di entitÃ parametro non devono essere riconosciuti in questo processo.

Se la parola chiave della sezione condizionale Ã¨ un riferimento di entitÃ -parametro, l'entitÃ parametro deve essere sostituita con il suo contenuto prima che il processore decida se includere o ignorare la sezione condizionale.

Un esempio:

<!ENTITY % draft 'INCLUDE' >
<!ENTITY % final 'IGNORE' >
<![%draft;[
<!ELEMENT book (comments*, title, body, supplements?)>
]]>
<![%final;[
<!ELEMENT book (title, body, supplements?)>
]]>

4 Strutture Fisiche

[Definizione: Un documento XML potrebbe consistere di una o molte unitÃ di allocazione. Queste vengono chiamate entitÃ ; tutte loro possiedono contenuto e tutte sono (eccetto per l'entitÃ documento e per il sotto-insieme esterno di DTD) identificate dal nome dell'entitÃ .] Ogni documento XML possiede un'entitÃ chiamata l'entitÃ document o, la quale funge da punto di partenza per il processore XML e potrebbe contenere l'intero documento.

Le entitÃ potrebbero essere sia parsed che non parsed. [Definizione: Si fa riferimento ai contenuti di un'entitÃ parsed come al suo testo sostitutivo; questo testo viene considerato parte integrale del documento.]

[Definizione: Un'entitÃ non parsed Ã¨ una risorsa i contenuti della quale potrebbero o non potrebbero essere testo, e qualora siano testo, potrebbero essere qualcosa di diverso da XML. Ogni entitÃ non parsed ha associata una notazione, identificata dal nome. Al di lÃ del requisito che un processore XML renda gli identificatori dell'entitÃ e la notazione disponibili all'applicazione, XML non pone alcun vincolo sui contenuti delle entitÃ non parsed.]

Le entitÃ parsed vengono invocate per nome usando i riferimenti di entitÃ ; le entitÃ non parsed per nome, dato nel valore degli attributi di ENTITY o ENTITIES.

[Definizione: Le entitÃ generali sono entitÃ per uso interno del contenuto del documento. In questa specifica, a volte ci si riferisce alle entitÃ generali con il termine non qualificato di entitÃ quando ciÃ² non porti a nessuna ambiguitÃ .] [Definizione: le entitÃ parametro sono entitÃ parsed per uso interno alla DTD.] Questi due tipi di entitÃ utilizzano forme differenti di riferimento e vengono riconosciute in contesti differenti. inoltre, occupano differenti ambiti dei nomi; un'entitÃ parametro e un'entitÃ generale con lo stesso nome sono due entitÃ distinte.

4.1 Riferimenti di EntitÃ e di Carattere

[Definizione: Un riferimento di carattere si riferisce a uno specifico carattere nell'insieme di caratteri ISO/IEC 10646, per esempio uno non direttamente accessibile dagli strumenti di immissione disponibili.]

Riferimento di Carattere

Se il riferimento di carattere inizia con "&#x", le cifre e le lettere fino al termine segnato con ; forniscono una rappresentazione esadecimale del punto codice del carattere in ISO/IEC 10646. Se comincia solo con "&#", le cifre fino al termine segnato con ; forniscono una rappresentazione decimale del punto codice del carattere.

[Definizione: Un riferimento di entitÃ si riferisce al contenuto di un'entitÃ avente un nome.] [Definizione: I riferimenti a entitÃ parsed generali usano le "e commerciale" (&) e il "punto e virgola" (;) come delimitatori.] [Definizione: I riferimenti di entitÃ -parametro usano il segno di percentuale (%) e il "punto e virgola" (;) come delimitatori.]

Riferimento di EntitÃ

Vincolo di Buona-Formazione: EntitÃ Dichiarata

In un documento senza alcuna DTD, un documento con solo un sotto-insieme interno di DTD che non contiene alcun riferimento di entitÃ parametro, oppure un documento con "standalone='yes'", per un riferimento di entitÃ che non ricorre all'interno del sotto-insieme esterno o un'entitÃ parametro, il Name dato nel riferimento di entitÃ deve corrispondere a quello in una dichiarazione di entitÃ che non ricorre all'interno del sotto-insieme esterno o di un entitÃ parametro, eccetto quello che i documento necessitano per non dichiarare una qualsiasi fra le seguenti entitÃ : amp, lt, gt, apos, quot. La dichiarazione di un'entitÃ generale deve precedere qualsiasi riferimento ad essa che appaia in un valore predefinito dentro una dichiarazione di elenco-attributo.

Si noti che i processori non-validanti non sono obbligati a leggere ed elaborare dichiarazioni di entitÃ ricorrenti nelle entitÃ parametro o nel sotto-insieme esterno; per tali documenti, la regola che un'entitÃ deve essere dichiarata Ã¨ un vincolo di buona-formazione solo se standalone='yes'.

Esempi di riferimenti di carattere e di entitÃ :

Digita <tasto>minore-di</tasto> (&#x3C;) per salvare le opzioni.
Questo documento Ã¨ stato preparato il &datadoc; ed
Ã¨ classificato &livello-sicurezza;.

Esempio di un riferimento di entitÃ -parametro:

 <!ENTITY % ISOLat2 SYSTEM "http://www.xml.com/iso/isolat2-xml.entities" >  %ISOLat2; 4.2 Dichiarazioni di EntitÃ

[Definizione: Le entitÃ sono dichiarate in questo modo:]

Dichiarazione di EntitÃ

Il Name identifica l'entitÃ in un riferimento di entitÃ oppure, nel caso di un'entitÃ non parsed, nel valore di un attributo di ENTITY o ENTITIES. Se la stessa entitÃ viene dichiarata piÃ¹ di una volta, la prima dichiarazione incontrata Ã¨ quella vincolante; a facoltÃ dell'utente, un processore XML potrebbe sottoporre un avvertimento se le entitÃ vengono dichiarate molteplici volte.

4.2.2 EntitÃ Esterne

[Definizione: Se l'entitÃ non Ã¨ interna, Ã¨ un'entitÃ esterna, dichiarata come segue:]

Dichiarazione di EntitÃ Esterna

Se Ã¨ presente il NDataDecl, questo Ã¨ un'entitÃ non parsed generale; altrimenti Ã¨ un'entitÃ parsed.

[Definizione: Il SystemLiteral viene chiamato l'identificatore di sistema dell'entitÃ . Si intende che venga convertito in un riferimento di URI (come definito in [IETF RFC 2396], aggiornata da [IETF RFC 2732]), come parte del processo del suo de-referenziamento per ottenere il dato in ingresso per il processore XML al fine di costruire il testo sostitutivo dell'entitÃ .] È un errore per un identificatore di frammento (che inizia con un carattere #) far parte di un identificatore di sistema. A meno che non sia fornita diversamente da informazioni al di fuori dell'ambito di questa specifica (ad es. da un tipo di elemento speciale di XML definito da una particolare DTD, o da un'istruzione di processo definita da una particolare specifica di applicazione), gli URI relativi sono relativi al luogo della risorsa all'interno della quale ricorre la dichiarazione di entitÃ . CiÃ² viene definito essere un'entitÃ esterna contenente il '<' che dÃ inizio alla dichiarazione, nel momento in cui subisce il parsing come una dichiarazione. Un URI potrebbe cosÃ¬ essere relativo all'entitÃ documento, all'entitÃ contenente il sotto-insieme esterno di DTD, oppure a qualche altra entitÃ parametro esterna. Tentativi di recuperare la risorsa identificata da un URI potrebbero essere re-indirizzati al livello di parser (per esempio, in un risolutore di entitÃ ) o piÃ¹ sotto (al livello di protocollo, per esempio attraverso un'intestazione HTTP Location:). In assenza di informazioni aggiuntive fuori dell'ambito di questa specifica all'interno della risorsa, l'URI di base di una risorsa Ã¨ sempre l'URI della risorsa corrente restituita. In altre parole, Ã¨ l'URI della risorsa recuperata dopo che sono ricorsi tutti i re-indirizzamenti.

Gli identificatori di sistema (e altre stringhe XML intese ad essere usate come riferimenti di URI) potrebbero contenere caratteri che, in accordo a [IETF RFC 2396] e a [IETF RFC 2732], devono essere codificati in caratteri escape prima che un URI possa essere usata per recuperare la risorsa referenziata. I caratteri da codificarsi in caratteri escape sono quelli di controllo da #x0 a #x1F e #x7F (molti dei quali non possono comparire in XML), la spaziatura #x20, i delimitatori '<' #x3C, '>' #x3E e '"' #x22, i caratteri non-significanti '{' #x7B, '}' #x7D, '|' #x7C, '\' #x5C, '^' #x5E e '`' #x60, cosÃ¬ come tutti i caratteri sopra #x7F. Dal momento che la codifica in caratteri escape non sempre Ã¨ un processo reversibile, deve essere eseguito solo quando assolutamente necessario e il piÃ¹ tardi possibile nella catena di elaborazione. In particolare, nÃ© il processo di conversione di un URI relativo in uno assoluto nÃ© il processo di passaggio di un riferimento di URI a un processo o componente software responsabile del de-referenziamento dovrebbe far scattare la codifica in caratteri escape. Quando questa codifica comunque ricorra, essa deve essere eseguita come segue:

Ogni carattere da codificarsi viene rappresentato in UTF-8 [Unicode3] come uno o piÃ¹ byte.
I byte risultanti vengono codificati con il meccanismo di codifica in caratteri escape degli URI (cioÃ¨, convertiti in %HH, dove HH Ã¨ la notazione esadecimale del valore di byte).
Il carattere originale viene sostituito dalla sequenza di caratteri risultante.

[Definizione: In aggiunta a un identificatore di sistema, un identificatore esterno potrebbe includere un identificatore pubblico.] Un processore XML che tenti di recuperare il contenuto dell'entitÃ potrebbe usare qualsiasi combinazione fra identificatori di sistema cosÃ¬ come informazioni aggiuntive al di fuori dell'ambito di questa specifica per tentare di generare un riferimento alternativo di URI. Se il processore non Ã¨ in grado di fare cosÃ¬, deve usare il riferimento di URI specificato nel letterale di sistema. Prima che si tenti una corrispondenza, tutte le stringhe di spazio bianco nell'identificatore pubblico devono essere normalizzate in spaziature (#x20) singole, e lo spazio bianco in testa e in coda deve essere rimosso.

Esempi di dichiarazioni di entitÃ esterne:

<!ENTITY open-hatch
SYSTEM "http://www.textuality.com/boilerplate/OpenHatch.xml">
<!ENTITY open-hatch
PUBLIC "-//Textuality//TEXT Standard open-hatch boilerplate//EN"
"http://www.textuality.com/boilerplate/OpenHatch.xml">
<!ENTITY hatch-pic
SYSTEM "../grafix/OpenHatch.gif"
NDATA gif >

4.3 EntitÃ parsed 4.3.3 Codifica di Carattere nelle EntitÃ Ogni entitÃ parsed esterna in un documento XML ha facoltÃ di usare una codifica differente per i suoi caratteri. Tutti i processori XML devono essere in grado di leggere entitÃ sia nella codifica UTF-8 che in quella UTF-16. I termini "UTF-8" e "UTF-16" in questa specifica non si applicano alle codifiche di carattere con qualsiasi altra etichetta, perfino se le codifiche o le etichette sono molto simili a UTF-8 o a UTF-16.

Le entitÃ codificate in UTF-16 devono e le entitÃ codificate in UTF-8 hanno facoltÃ di iniziare con il Segno di Ordine di Byte {Byte Order Mark} descritto dall'Annex H di [ISO/IEC 10646:2000], sezione 2.4 di [Unicode], e sezione 2.7 di [Unicode3] (il carattere di LUNGHEZZA ZERO SPAZIO DI NON-INTERRUZIONE, #xFEFF). Questa Ã¨ una firma di codifica, non facente parte nÃ© della marcatura, nÃ© dei dati carattere del documento XML. I processori XML devono essere in grado di usare questo carattere per operare la differenza tra i documenti codificati in UTF-8 e in UTF-16.

Sebbene a un processore XML si richieda di saper leggere solo le entitÃ nelle codifiche UTF-8 e UTF-16, viene riconosciuto che altre codifiche vengono usate nel mondo, e si potrebbe desiderare che i processori XML leggano le entitÃ che le utilizzano. In assenza di informazioni esterne sulla codifica di carattere (come le intestazioni MIME), le entitÃ parsed che sono allocate in una codifica diversa sia dalla UTF-8 che dalla UTF-16 devono iniziare con una dichiarazione di testo (vedi 4.3.1 La Dichiarazione di Testo) contenente una dichiarazione di codifica:

Dichiarazione di Codifica [80] EncodingDecl ::= S 'encoding' Eq ('"' EncName '"' | "'" EncName "'" ) [81] EncName ::= [A-Za-z] ([A-Za-z0-9._] | '-')* /* Il nome di codifica contiene solo caratteri Latini */

In un entitÃ documento, la dichiarazione di codifica fa parte della dichiarazione XML. L'EncName Ã¨ il nome della codifica utilizzata.

In una dichiarazione di codifica, i valori "UTF-8", "UTF-16", "ISO-10646-UCS-2", and "ISO-10646-UCS-4" dovrebbero essere usati per le varie codifiche e trasformazioni di Unicode / ISO/IEC 10646, i valori "ISO-8859-1", "ISO-8859-2", ... "ISO-8859-n" (dove n Ã¨ il numero di parte) dovrebbero essere usati per le parti di ISO 8859, e i valori "ISO-2022-JP", "Shift_JIS", e "EUC-JP" dovrebbero essere usati per le varie forme codificate di JIS X-0208-1997. È Raccomandato che ci si riferisca alle codifiche di carattere registrate (come charset) dall'AutoritÃ Internet per i Numeri Assegnati {Internet Assigned Numbers Authority} [IANA-CHARSETS], diverse da quelle appena elencate, usando i loro nomi registrati; altre codifiche dovrebbero usare i nomi che iniziano con un prefisso "x-". I processori XML dovrebbero confrontare i nomi delle codifiche di carattere in una maniera indifferente alle maiuscole {case-insensitive} e dovrebbero sia interpretare un nome registrato in IANA come la codifica registrata presso IANA per quel nome sia trattarlo come sconosciuto (i processori, naturalmente, non sono obbligati a supportare tutte le codifiche registrate in IANA).

In assenza di informazioni fornite da un protocollo esterno di trasporto (ad es. HTTP o MIME), Ã¨ un errore fatale per un'entitÃ includere una dichiarazione di codifica che deve essere presentata al processore XML in una codifica differente da quella che Ã¨ stata nominata nella dichiarazione, o per un'entitÃ che inizi nÃ© con un Segno di Ordine di Byte, nÃ© con una dichiarazione di codifica per usare una codifica diversa dalla UTF-8. Si noti che dal momento che ASCII Ã¨ un sotto-insieme di UTF-8, le entitÃ ordinarie di ASCII non hanno strettamente necessitÃ di una dichiarazione di codifica.

È un errore fatale per una TextDecl ricorrere in un punto diverso dall'inizio di un'entitÃ esterna.

Ã un errore fatale quando un processore XML incontra un'entitÃ con una codifica che esso non Ã¨ in grado di elaborare. Ã un errore fatale se un'entitÃ XML viene determinata (attraverso valore predefinito, dichiarazione di codifica, o protocolli di piÃ¹ alto livello) essere di una certa codifica ma contiene sequenze di byte che non sono legali in quella codifica. In special modo, Ã¨ un errore fatale se un'entitÃ codificata in UTF-8 contiene qualsiasi sequenza di unitÃ di codice irregolari, come definito in Unicode 3.1 [Unicode3]. A meno che una codifica non sia determinata da un protocollo di piÃ¹ alto livello, inoltre Ã¨ un errore fatale se un'entitÃ XML non contiene alcuna dichiarazione di codifica e il suo contenuto non Ã¨ UTF-8 o UTF-16 legale.

Esempi di dichiarazioni di testo contenenti dichiarazioni di codifica:

<?xml encoding='UTF-8'?>
<?xml encoding='EUC-JP'?>

4.3.4 Informazioni di Versione nelle EntitÃ

Ogni entitÃ , inclusa l'entitÃ documento, puÃ² essere dichiarata separatamente come XML 1.0 o XML 1.1. La dichiarazione di versione che compare nell'entitÃ documento determina la versione del documento nel suo intero. Un documento XML 1.1 potrebbe invocare entitÃ esterne XML 1.0, cosicchÃ© versioni in altro modo duplicate delle entitÃ esterne, in particolare i sotto-insiemi esterni di DTD, non hanno bisogno di manutenzione. Comunque, in tali casi le regole di XML 1.1 vengono applicate all'intero documento.

Se un'entitÃ (inclusa l'entitÃ documento) non Ã© etichettata con un numero di versione, viene trattata come se fosse etichettata come versione 1.0.

4.4 Trattamento del Processore XML di EntitÃ e Riferimenti

La tabella sottostante riassume i contesti nei quali potrebbero comparire i riferimenti di carattere, i riferimenti di entitÃ , e le invocazioni di entitÃ non parsed e il comportamento obbligatorio di un processore XML in ciascun caso. Le etichette nella colonna di estrema sinistra descrivono il contesto riconoscitivo:

Riferimento nel Contenuto: come un riferimento dovunque dopo il tag-di-inizio e prima del tag-di-fine di un elemento; corrisponde al contenuto non-terminale.
Riferimento nel Valore di Attributo: come un riferimento all'interno sia del valore di un attributo in un tag-di-inizio, che un valore predefinito in una dichiarazione di attributo; corrisponde a AttValue non-terminale.
Ricorre come Valore di Attributo: come un Name, non un riferimento, che compaia sia come il valore di un attributo che Ã¨ stato dichiarato come tipo ENTITY, oppure come uno dei token separati-da-spazio nel valore di un attributo che Ã¨ stato dichiarato come tipo ENTITIES.
Riferimento in Valore di EntitÃ: come un riferimento all'interno di un parametro o del valore letterale di entitÃ di un'entitÃ interna nella dichiarazione di entitÃ ; corrisponde a EntityValue non-terminale.
Riferimento in DTD: come un riferimento all'interno sia dei sotto-insiemi interni ed esterni della DTD, ma al di fuori di un EntityValue, AttValue, PI, Comment, SystemLiteral, PubidLiteral, oppure dei contenuti di una sezione condizionale ignorata (vedi 3.4 Sezioni Condizionali).
.

4.4.2 Incluso

[Definizione: Un'entitÃ Ã¨ inclusa quando il suo testo sostitutivo viene recuperato ed elaborato, al posto del riferimento stesso, come se fosse parte del documento nel posto in cui il riferimento Ã¨ stato riconosciuto.] Il testo sostitutivo potrebbe contenere sia dati carattere che (eccetto per le entitÃ parametro) marcatura, che deve essere riconosciuto nel modo usuale. (La stringa "AT&T;" si espande in "AT&T;" e la "e commerciale" rimanente non viene riconosciuta come un delimitatore di riferimento di entitÃ .) Un riferimento di carattere Ã¨ incluso quando il carattere indicato viene elaborato al posto del riferimento stesso.

4.4.3 Incluso Se Validante

Quando un processore XML riconosce un riferimento a un'entitÃ parsed, per validare il documento, il processore deve includere il suo testo sostitutivo. Se l'entitÃ Ã¨ esterna, e il processore non sta tentando di validare il documento XML, il processore ha facoltÃ , ma non ha bisogno, di includere il testo sostitutivo dell'entitÃ . Se un processore non-validante non include il testo sostitutivo, esso deve informare l'applicazione che ha riconosciuto, ma non ha letto, l'entitÃ .

Questa regola si basa sul riconoscimento che l'inclusione automatica fornita dal meccanismo di entitÃ di SGML e XML, primariamente progettato per supportare la modularitÃ nella creazione di documenti, non Ã¨ necessariamente appropriato per altre applicazioni, in particolare la navigazione fra i documenti. I browser, per esempio, quando incontrano un riferimento di entitÃ parsed esterna, potrebbero scegliere di fornire un'indicazione visiva della presenza dell'entitÃ e recuperarla in visualizzazione solo su richiesta.

4.4.5 Incluso alla Lettera

Quando un riferimento di entitÃ compare in un valore di attributo, o un riferimento di entitÃ parametro compare in un valore di entitÃ letterale, il suo testo sostitutivo deve essere elaborato al posto del riferimento stesso come se fosse parte del documento nel posto in cui Ã¨ stato riconosciuto il riferimento, eccetto per il fatto che un carattere di virgolette singole o doppie nel testo sostitutivo deve sempre venire trattato come un carattere dato normale e non deve terminare il letterale. Per esempio, questo Ã¨ ben-formato:

<!ENTITY % YN '"Yes"' >
<!ENTITY WhatHeSaid "He said %YN;" >

mentre questo non lo Ã¨:

<!ENTITY EndAttr "27'" >
<element attribute='a-&EndAttr;>

4.5 Costruzione di Testo Sostitutivo di EntitÃ

Nel discutere il trattamento delle entitÃ , Ã¨ utile distinguere due forme di valore dell'entitÃ . [Definizione: Per un'entitÃ interna, il valore letterale di entitÃ Ã¨ la stringa virgolettata effettivamente presente nella dichiarazione di entitÃ , corrispondente all'EntityValue non-terminale.] [Definizione: Per un'entitÃ esterna, il valore letterale di entitÃ Ã¨ il testo esatto contenuto dall'entitÃ .] [Definizione: Per un'entitÃ interna, il testo sostitutivo Ã¨ il contenuto dell'entitÃ , dopo la sostituzione dei riferimenti di carattere e dei riferimenti di entitÃ -parametro.] [Definizione: Per un'entitÃ esterna, il testo sostitutivo Ã¨ il contenuto dell'entitÃ , dopo la rimozione della dichiarazione di testo (lasciando ogni spazio vuoto intorno) se ne esiste uno, ma senza alcuna sostituzione di riferimenti di carattere o di riferimenti di entitÃ -parametro.]

Il valore letterale di entitÃ come fornito in una dichiarazione di entitÃ interna (EntityValue) potrebbe contenere riferimenti di carattere, entitÃ -parametro, e di entitÃ -generale. Tali riferimenti devono essere interamente contenuti all'interno del valore letterale di entitÃ . Il testo sostitutivo reale che viene incluso (o Incluso alla lettera) come sopra descritto deve contenere il testo sostitutivo di qualsiasi entitÃ parametro alla quale si riferisce, e deve contenere il carattere al quale si riferisce, al posto di qualsiasi riferimento di carattere nel valore letterale di entitÃ ; comunque, i riferimenti di entitÃ -generale devono essere lasciati cosÃ¬ come sono, non espansi. Per esempio, date le seguenti dichiarazioni:

<!ENTITY % pub    "&#xc9;ditions Gallimard" >
<!ENTITY   rights "All rights reserved" >
<!ENTITY   book   "La Peste: Albert Camus,
&#xA9; 1947 %pub;. &rights;" >

allora il testo sostitutivo per l'entitÃ "book" Ã¨:

La Peste: Albert Camus,
Â© 1947 Ãditions Gallimard. &rights;

Il riferimento di entitÃ -generale "&rights;" sarebbe stato espanso se il riferimento "&book;" dovesse comparire nel contenuto del documento o in un valore di attributo. Queste semplici regole potrebbero avere interazioni complesse; per una trattazione dettagliata di un esempio difficile, si veda C Espansione dei Riferimenti di EntitÃ e di Carattere. 4.6 EntitÃ Predefinite

[Definizione: I riferimenti di entitÃ e di carattere potrebbero entrambi essere usati per codificare in carattere escape la parentesi angolare sinistra, la "e commerciale", e gli altri delimitatori. Un insieme di entitÃ generali (amp, lt, gt, apos, quot) viene specificato a questo scopo. Anche i riferimenti numerici di carattere potrebbero essere utilizzati; essi vengono espansi immediatamente quando riconosciuti e devono essere trattati come dati carattere, cosÃ¬ i riferimenti numerici di carattere "<" e "&" potrebbero essere usati per codificare in caratteri escape < e & quando ricorrono nei dati carattere.]

Tutti i processori XML devono riconoscere queste entitÃ se vengono dichiarate o no. Per interoperabilitÃ , i documenti XML validi dovrebbero dichiarare queste entitÃ , come qualsiasi altra, prima di utilizzarle. Se le entitÃ lt o amp vengono dichiarate, esse devono venire dichiarate come entitÃ interne il testo sostitutivo delle quali Ã¨ un riferimento di carattere al rispettivo carattere da codificarsi in caratteri escape (segno di minore-di o "e commerciale"); la doppia codifica in caratteri escape Ã¨ Richiesta per queste entitÃ cosicchÃ© i riferimenti ad esse producano un risultato ben-formato. Se le entitÃ gt, apos, o quot vengono dichiarate, esse devono venire dichiarate come entitÃ interne il testo sostitutivo delle quali Ã¨ un singolo carattere codificato in caratteri escape (o un riferimento di carattere a quel carattere; la doppia codifica in caratteri escape Ã¨ facoltativa, ma innocua). Per esempio:

<!ENTITY lt     "&#38;#60;">
<!ENTITY gt     "&#62;">
<!ENTITY amp    "&#38;#38;">
<!ENTITY apos   "&#39;">
<!ENTITY quot   "&#34;">

4.7 Dichiarazioni di Notazione

[Definizione: Le notazioni identificano per nome il formato di entitÃ non parsed, il formato degli elementi che portano un attributo di notazione, oppure l'applicazione alla quale viene indirizzata un'istruzione di processo.]

[Definizione: Le dichiarazioni di notazione forniscono un nome per la notazione, per l'uso nelle dichiarazioni di entitÃ e di elenco-attributo e nelle specificazioni di attributo, e un identificatore esterno per la notazione che potrebbe permettere a un processore XML o alla sua applicazione client di localizzare un'applicazione di supporto capace di elaborare i dati nella notazione fornita.]

Dichiarazioni di Notazione

I processori XML devono fornire alle applicazioni nome e identificatore/i di qualsiasi notazione dichiarata e referenziata in un valore di attirbuto, in una definizione di attributo, o in una dichiarazione di entitÃ . In aggiunta essi hanno facoltÃ di risolvere l'identificatore esterno nell'identificatore di sistema, nel nome di file, o in altre informazioni necessarie per consentire all'applicazione di chiamare un processore per i dati nella notazione descritta. (Ã un errore, comunque, per i documenti XML dichiarare e riferirsi a notazioni per le quali non sono disponibili, sul sistema dove sta girando il processore XML o l'applicazione, applicazioni specifiche per la notazione stessa.)

4.8 EntitÃ Documento

[Definizione: L'entitÃ documento serve come radice dell'alberatura delle entitÃ e come punto di partenza per un processore XML.] Questa specifica non precisa come l'entitÃ documento debba essere localizzata da un processore XML; a differenza di altre entitÃ , l'entitÃ documento non ha nome e potrebbe comparire bene in un flusso di dati in ingresso per un processore senza alcuna identificazione.

5 ConformitÃ 5.1 Processori Validanti e Non-Validanti

I processori XML conformi ricadono in due classi: validanti e non-validanti.

I processori validanti e non-validanti devono riportare allo stesso modo le violazioni dei vincoli di buona-formazione di questa specifica nel contenuto dell'entitÃ documento e di qualsiasi altra entitÃ parsed che essi leggono.

[Definizione: I processori validanti devono, a facoltÃ dell'utente, riportare le violazioni dei vincoli espressi dalle dichiarazioni nella DTD, e i fallimenti nell'adempiere ai vincoli di validitÃ forniti in questa specifica.] Per conseguire ciÃ², i processori XML validanti devono leggere ed elaborare l'intera DTD e tutte le entitÃ parsed esterne alle quali si fa riferimento nel documento.

I processori non-validanti sono obbligati a controllare la buona-formazione solo dell'entitÃ documento, includendo l'intero sotto-insieme interno della DTD. [Definizione: Mentre essi non sono obbligati a controllare la validitÃ del documento, sono obbligati a processare tutte le dichiarazioni che leggono nel sotto-insieme interno della DTD e in qualsiasi entitÃ parametro, fino al primo riferimento a un'entitÃ parametro che non leggono; vale a dire, essi devono utilizzare le informazioni in quelle dichiarazioni per normalizzare i valori di attributo, includere il testo sostitutivo delle entitÃ interne, e supportare i valori predefiniti di attributo.] Eccetto quando standalone="yes", essi devono processare le dichiarazioni di entitÃ o le dichiarazioni di elenco-attributo incontrate dopo un riferimentoa un'entitÃ parametro che non viene letta, da momento che l'entitÃ potrebbe contenere dichiarazioni sovrascriventi; quando standalone="yes", i processori devono elaborare queste dichiarazioni.

Si noti che quando si elaborano documenti non validi con un processore non-validante l'applicazione potrebbe non essere presentata con informazioni consistenti. Per esempio, alcuni requisiti per l'unicitÃ all'interno del documento potrebbero non essere rispettati, includendo piÃ¹ di un solo elemento con lo stesso id, dichiarazioni duplicate di elementi o notazioni con lo stesso nome, etc. In questi casi il comportamento del parser rispetto al dispaccio di tali informazioni verso l'applicazione non Ã¨ definito.

XML 1.1 processors MUST be able to process both XML 1.0 and XML 1.1 documents. Programs which generate XML SHOULD generate XML 1.0, unless one of the specific features of XML 1.1 is required.

5.2 Usare i Processori XML Il comportamento di un processore XML validante Ã¨ altamente prevedibile; esso deve leggere ogni pezzo di un documento e riportare tutte le violazioni di buona-formazione e di validitÃ . Viene richiesto meno a un processore non-validante; esso non ha bisogno di leggere qualsiasi parte del documento diversa dall'entitÃ documento. CiÃ² ha due effetti che potrebbero essere importanti per gli utenti dei processori XML:

Certi errori di buona-formazione, specificatamente quelli che richiedono la lettura di entitÃ esterne, potrebbero non essere rilevati da un processore non-validante. Esempi comprendono i vincoli intitolati EntitÃ Dichiarata, EntitÃ Parsed, e Nessuna RicorsivitÃ , cosÃ¬ come alcuni dei casi descritti come proibiti in 4.4 Trattamento del processore XML di EntitÃ e di Riferimenti.
Le informazioni passate dal processore all'applicazione potrebbero variare, in dipendenza del fatto che il processore legga le entitÃ parametro ed esterne. Per esempio, un processore non-validante potrebbe fallire nel normalizzare i valori di attributo, nell'includere il testo sostitutivo di entitÃ interne, o supportare i valori predefiniti di attributo, quando farlo dipenda dall'aver letto le dichiarazioni nelle entitÃ esterne e di parametro.

Per la massima affidabilitÃ nell'interoperazione fra diversi processori XML, le applicazioni che utilizzano processori non-validanti non dovrebbero far affidamento su alcun comportamento non richiesto a tali processori. Le applicazioni che richiedono le capacitÃ della DTD relative alla convalida (come la dichiarazione degli attributi predefiniti e delle entitÃ interne che sono o potrebbero essere specificate nelle entitÃ esterne) dovrebbero utilizzare processori XML validanti.

RetroSearch is an open source project built by @garambo | Open a GitHub Issue

Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo

HTML: 3.2 | Encoding: UTF-8 | Version: 0.7.4