Reglas de sintaxis XML
Las reglas de sintaxis de XML son muy simples y lógicas. Las reglas son fáciles de aprender y fáciles de usar.
Los documentos XML deben tener un elemento raíz
Los documentos XML deben contener un elemento raíz que sea el padre de todos los demás elementos:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
En este ejemplo , <nota> es el elemento raíz:
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
El prólogo XML
Esta línea se llama prólogo XML :
<?xml version="1.0" encoding="UTF-8"?>
El prólogo XML es opcional. Si existe, debe aparecer primero en el documento.
Los documentos XML pueden contener caracteres internacionales, como øæå noruego o êèé francés.
Para evitar errores, debe especificar la codificación utilizada o guardar sus archivos XML como UTF-8.
UTF-8 es la codificación de caracteres predeterminada para documentos XML.
La codificación de caracteres se puede estudiar en nuestro Tutorial de conjunto de caracteres .
UTF-8 también es la codificación predeterminada para HTML5, CSS, JavaScript, PHP y SQL.
Todos los elementos XML deben tener una etiqueta de cierre
En XML, es ilegal omitir la etiqueta de cierre. Todos los elementos deben tener una etiqueta de cierre:
<p>This is a paragraph.</p>
<br />
Nota: ¡El prólogo XML no tiene una etiqueta de cierre! Esto no es un error. El prólogo no es parte del documento XML.
Las etiquetas XML distinguen entre mayúsculas y minúsculas
Las etiquetas XML distinguen entre mayúsculas y minúsculas. La etiqueta <Letra> es diferente de la etiqueta <letra>.
Las etiquetas de apertura y cierre deben escribirse con el mismo caso:
<message>This is correct</message>
Las "etiquetas de apertura y cierre" a menudo se denominan "etiquetas de inicio y fin". Usa lo que prefieras. Es exactamente lo mismo.
Los elementos XML deben estar correctamente anidados
En HTML, es posible que vea elementos anidados incorrectamente:
<b><i>This text is bold and italic</b></i>
En XML, todos los elementos deben estar correctamente anidados entre sí:
<b><i>This text is bold and italic</i></b>
En el ejemplo anterior, "Anidado correctamente" simplemente significa que, dado que el elemento <i> se abre dentro del elemento <b>, debe cerrarse dentro del elemento <b>.
Los valores de los atributos XML siempre se deben citar
Los elementos XML pueden tener atributos en pares de nombre/valor como en HTML.
En XML, los valores de los atributos siempre se deben citar:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
Referencias de entidades
Algunos caracteres tienen un significado especial en XML.
Si coloca un carácter como "<" dentro de un elemento XML, generará un error porque el analizador lo interpreta como el comienzo de un nuevo elemento.
Esto generará un error XML:
<message>salary < 1000</message>
Para evitar este error, reemplace el carácter "<" con una referencia de entidad :
<message>salary < 1000</message>
Hay 5 referencias de entidades predefinidas en XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Solo < y & son estrictamente ilegales en XML, pero es un buen hábito reemplazar > con > también.
Comentarios en XML
La sintaxis para escribir comentarios en XML es similar a la de HTML:
<!-- This is a comment -->
No se permiten dos guiones en medio de un comentario:
<!-- This is an invalid -- comment -->
El espacio en blanco se conserva en XML
XML no trunca varios espacios en blanco (HTML trunca varios espacios en blanco en un solo espacio en blanco):
XML: | Hello Tove |
HTML: | Hello Tove |
XML almacena nueva línea como LF
Las aplicaciones de Windows almacenan una nueva línea como: retorno de carro y avance de línea (CR+LF).
Unix y Mac OSX usan LF.
Los viejos sistemas Mac usan CR.
XML almacena una nueva línea como LF.
XML bien formado
Los documentos XML que se ajustan a las reglas de sintaxis anteriores se denominan documentos XML "bien formados".