DTD - Bloques de construcción XML
Los principales componentes básicos de los documentos XML y HTML son los elementos.
Los componentes básicos de los documentos XML
Visto desde el punto de vista de la DTD, todos los documentos XML están compuestos por los siguientes bloques de construcción:
- Elementos
- Atributos
- Entidades
- PCDATOS
- CDATA
Elementos
Los elementos son los principales componentes básicos de los documentos XML y HTML.
Ejemplos de elementos HTML son "cuerpo" y "tabla". Ejemplos de elementos XML podrían ser "nota" y "mensaje". Los elementos pueden contener texto, otros elementos o estar vacíos. Ejemplos de elementos HTML vacíos son "hr", "br" e "img".
Ejemplos:
<body>some text</body>
<message>some text</message>
Atributos
Los atributos proporcionan información adicional sobre los elementos .
Los atributos siempre se colocan dentro de la etiqueta de apertura de un elemento. Los atributos siempre vienen en pares de nombre/valor. El siguiente elemento "img" tiene información adicional sobre un archivo fuente:
<img src="computer.gif" />
El nombre del elemento es "img". El nombre del atributo es "src". El valor del atributo es "computer.gif". Dado que el elemento en sí está vacío, se cierra con un "/".
Entidades
Algunos caracteres tienen un significado especial en XML, como el signo de menos que (<) que define el inicio de una etiqueta XML.
La mayoría de ustedes conoce la entidad HTML: " ". Esta entidad "sin espacio de ruptura" se usa en HTML para insertar un espacio adicional en un documento. Las entidades se expanden cuando un analizador XML analiza un documento.
Las siguientes entidades están predefinidas en XML:
Entity References | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATOS
PCDATA significa datos de caracteres analizados.
Piense en los datos de caracteres como el texto que se encuentra entre la etiqueta inicial y la etiqueta final de un elemento XML.
PCDATA es texto que será analizado por un analizador . El texto será examinado por el analizador en busca de entidades y marcas .
Las etiquetas dentro del texto se tratarán como marcas y las entidades se expandirán.
Sin embargo, los datos de caracteres analizados no deben contener ningún carácter &, < o >; estos deben estar representados por el & < y > entidades, respectivamente.
CDATA
CDATA significa datos de caracteres.
CDATA es texto que NO será analizado por un analizador . Las etiquetas dentro del texto NO se tratarán como marcado y las entidades no se expandirán.