Lenguaje de marcacion generalizado y standard SGML
SGML fue diseñado para ser una manera estándar de marcar datos para cualquier propósito y sobre todo para impulsar la mayoría de los sistemas de administración de documentos grandes.
El lenguaje SGML es complicado porque maneja enormes cantidades de datos complejos.
SGML es complejo pero muy poderoso.
Del lenguaje SGMLse derivan dos sublenguajes: HTMLy XML.
HTML
El lenguaje de marcación de hipertexto HTMLestá orientado hacia la presentación de los
textos y sus ligas hacia otra información.
HTML con XML
La etiqueta <xml> puede emplearse para incrustar código XML dentro de un documento HTML.
Isla de Datos
Se denomina isla de datos (Data island) al hecho de poder ligar datos obtenidos de un documento XMLa un archivo HTML.
XML
El lenguaje de marcación extensible XMLse enfoca en la descripción y la estructura de los
datos (información).
El lenguaje XMLusa etiquetas que el mismo usuario inventa según sus necesidades para
estructurar sus datos.
Beneficios
1 Es multiplataforma, los archivos pueden leerse en sistemas con Windows, Unix, etcétera.
2 Es un estándar abierto.
Ampliamente usado.
3 Diseñado para la web y otras aplicaciones comerciales (Word, Excel, etcétera).
4 Existen muchas herramientas que incorporan este lenguaje.
5 Es fácil de interpretar por las personas y por las aplicaciones de cómputo.
Usos
1 En la web para publicar documentos interactivos.
2 Como fuente de datos para ser administrados (por ejemplo: lista de empleados en XML).
3 Para publicar en celulares, radiolocalizadores y dispositivos móviles de comunicación.
4 Para intercambio de datos entre negocios.
5 Para crear lenguajes orientados hacia las matemáticas, la química, música, etcétera
6 Para la publicación estructurada de recursos (archivos HTML, Word, Excel, PowerPoint,
PDF, etcétera) y el intercambio de los mismos.
Sintaxis
Para escribir un archivo XMLpodemos usar cualquier editor de textos, por ejemplo, el bloc de
notas de Windows. Una vez terminado el archivo debe guardarse asignándole un nombre y la
extensión *.XML
Rreglas de la sintaxis
Subtopic
1. Cada elemento tiene dos etiquetas: la de inicio y la de fin. Un elemento consta de tres partes: la etiqueta de inicio, el contenido y la etiqueta de fin.
2. Hay un solo elemento raíz y dentro de él puede haber cero o más elementos
3. Los nombres de las etiquetas son sensibles a las mayúsculas. En otras palabras, la etiqueta de inicio <pelicula> se considera diferente de la también etiqueta de inicio <Pelicula>.
4. Los elementos deben anidarse de manera correcta sin ocasionar traslapes. XML permite una
estructura jerárquica de tal forma que el elemento raíz puede tener varios elementos hijos y, a su vez, cada elemento hijo puede tener anidados más elementos propios.
5. Los nombres de los elementos deben cumplir con las siguientes reglas:
A.-Contienen letras, números y otros caracteres.
B.-No empezar con un número ni con un carácter de puntuación.
C.-No empezar con xml, Xml, XML, etcétera.
D.-No contener espacios.
6. Los elementos pueden contener atributos, los cuales estarán entre comillas de manera obligatoria.
7. Con XML, los espacios en blanco se preservan.
Los espacios en blanco entre las etiquetas de elementos se ignoran por completo. Pero en el
contenido del elemento los espacios sí se conservan.
8. Los comentarios en XML son como en HTML.
Tipos de documentos XML
Documentos XMLbien formados
Un documento XMLbien formado debe iniciar con una entidad de procesamiento de la forma:
<?xml version=”1.0” encoding=”ISO-8859-1”?>
Y en seguida se escribe el documento XMLcon base en las reglas de sintaxis de XML
El atributo version=”1.0” es hasta hoy la versión actual del lenguaje XML, mientras que el
atributo encoding=”ISO-8859-1” debe utilizarse siempre que el contenido de los elementos sean
palabras de origen latino (como acentos, eñes, etcétera). Si se omite el atributo encoding, xml
considera que el conjunto de caracteres es UTF-8, es decir, inglés.
Documentos XML válidos
Para que un documento XMLsea válido se requiere que sea XMLbien formado, y que además
contenga una manera de validar los tipos de datos que pueden ir en cada elemento XML. Para
ello se emplean archivos adicionales denominados DTD(Data Type Document-Documento de
Definición de Tipos de datos) o archivos XSD o esquemas de XML.
Aplicaciones de XML
Las aplicaciones de XMLson muchas y muy variadas, pero se pueden clasificar en cuatro
subcategorías:
1.- Lenguajes planeados para formas no textuales de datos como: el lenguaje MathML orientado hacia la descripción de notaciones matemáticas en la web. SVG(gráficas con vectores
escalables), un lenguaje para describir gráficas en XML.
2.- Lenguajes planeados para publicación en web: El ejemplo básico es el lenguaje XHTML, el
cual es una reformulación del lenguaje HTML. Las aplicaciones Xframes, Xforms, que son
lenguajes orientados hacia el manejo de frames (marcos) y formas.
3.- Lenguajes planeados para la semántica en web. Su propósito es estandarizar reglas para
agregar metadata semántica y confianza a la web
4.- Aplicaciones relacionadas con las comunicaciones y servicios en la web. Aquí los lenguajes
derivados de XMLse orientan hacia los servicios web y la comunicación entre clientes y
servidores. SOAP(Simple Object Access Protocol, protocolo de acceso a objeto simple) sirve
para el intercambio de información en un ambiente distribuido.
Ejemplos en Word y en excel
Excel
Los archivos XMLpueden ser fuente de datos para alimentar una hoja de cálculo, debido a que
las versiones profesionales de Microsoft Office 2003 y la edición Office 2007 son compatibles
con XML. Incluso el formato predeterminado de archivo de Office Excel, Word y PowerPoint
2007 es XML.
Word
Las posibilidades de automatización y programabilidad de documentos se hacen presentes en
varios escenarios debido al formato o características adoptadas en la versión Office Word 2007,
para estructurar documentos como datos XML, un campo de acción de los desarrolladores de
tecnologías.
No obstante, los usuarios en general podemos reconocer algunas funciones y abrir documentos XMLcon Word y ver el documento marcado con etiquetas. Esto es, Utilizar Word como editor
de archivos XML, donde cada nombre de etiqueta se despliega en color morado, con diferente forma
para etiquetas de inicio y de fin.
Publicación estructurada de recursos
Nos referimos a lo siguiente: publicación porque se puede realizar para desplegarse en varios
medios como la web (páginas de internet) u otros medios electrónicos como los de multimedia.
Hablamos de recursos como cualquier tipo de archivo de cualquier formato y elaborado con
muy distintas aplicaciones, pero que consideramos debe compartirse. Así, un recurso puede
ser, por ejemplo:
Un documento de texto
Una hoja de cálculo
Un video
Una página web
Un archivo de Word
Una presentación
Un archivo PDF
Un archivo ejecutable
Una imagen
Una liga hacia un URL
Una animación
Un sonido
Un archivo XML