Publicación estructurada de recursos
4.1 Introducción a XML
Se enfoca en la descripción y la estructura de los datos (información.
Es un estándar para crear lenguajes que cumplan con los criterios que el XML establece. El lenguaje XML usa etiquetas que el mismo usuario inventa según sus necesidades para estructurar sus datos.
Beneficios de XML.
* Es multiplataforma, los archivos pueden leerse en sistemas con Windows, Unix, etc.
*Es un estándar abierto.
*Ampliamente usado.
*Diseñado para la web y otras aplicaciones comerciales (Word, Excel, etc.)
*Existen muchas herramientas que incorporan este lenguaje.
*Es fácil de interpretar por las personas y por las personas y por las aplicaciones de cómputo.
Usos de XML.
* En la web para publicar documentos interactivos.
*Como fuente de datos para ser administrados (Lista de empleados e XML).
*para publicar en dispositivos de comunicación.
*Intercambio de datos entre negocios.
*para crear lenguajes orientados hacia las matemáticas, química, música, etc.
*publicaciones estructuradas de recursos y el intercambio de los mismos.
4.2 Sintaxis de XML
Para escribir un archivo XML podemos usar cualquier editor de textos. Una ves terminado el archivo debe guardarse asignándoles un nombre y la extensión *XML.
Reglas de sintaxis de XML.
Cada elemento tiene dos etiquetas: la de inicio y la de fin. Un elemento consta de tres partes: la etiqueta de inicio, el contenido y la etiqueta de fin.
Hay un solo elemento raíz y dentro de él puede haber cero o más elementos.
Los nombres de las etiquetas son sensibles a las mayúsculas.
Los elementos deben anidarse de manera correcta sin ocasionar traslapes. XML permite una estructura jerárquica de tal forma que el elemento raíz puede tener varios elementos hijos y, a su vez, cada elemento hijo puede tener anidados más elementos propios.
Los nombres de los elementos deben cumplir con las siguientes reglas:
Contienen letras, números y otros caracteres.
No empezar con un número ni con un carácter de puntuación.
No empezar con xml, Xml, XML, etcétera.
No contener espacios.
Se recomienda usar nombres descriptivos y no usar guiones medios (-).
Los elementos pueden contener atributos, los cuales estarán entre comillas de manera obligatoria
Con XML, los espacios en blanco se preservan. Los espacios en blanco entre las etiquetas de elementos se ignoran por completo. Pero en el contenido del elemento los espacios sí se conservan.
Los comentarios en XML son como en HTML
4.3 Tipos de documentos XML
Los documentos XML pueden ser de dos tipos: los bien formados y los validos.
Documentos XML bien formados.
Debe iniciar con una entidad de procesamiento de la forma:
<?xml version=”1.0” encoding=”ISO-8859-1”?>
Y en seguida se escribe el documento XML con base en las reglas de sintaxis de XML
El atributo version=”1.0” es hasta hoy la versión actual del lenguaje XML, mientras que el atributo encoding=”ISO-8859-1” debe utilizarse siempre que el contenido de los elementos sean palabras de origen latino (como acentos, eñes, etcétera). Si se omite el atributo encoding, xml considera que el conjunto de caracteres es UTF-8, es decir, inglés.
Documentos XML validos.
Se requiere que sea XML bien formado, y que además contenga una manera de validar los tipos de datos que pueden ir en cada elemento XML. Para ello se emplean archivos adicionales denominados DTD (Data Type Document-Documento de Definición de Tipos de datos) o archivos XSD o esquemas de XML
4.4 HTML con XML.
La etiqueta <xml> puede emplearse para incrustar código XML dentro de un documento HTML. Obsérvese que tal etiqueta <xml> no pertenece al lenguaje XML, sino al HTML. Dentro de un código HTML es posible insertar código XML
Isla de datos.
Se denomina isla de datos (Data island) al hecho de poder ligar datos obtenidos de un documento XML a un archivo HTML.