Fundamentos de la Interacción
Persona-Ordenador
5. XHTML
Luis Rodríguez Baena (
[email protected])
Universidad Pontificia de Salamanca
Escuela Superior de Ingeniería y Arquitectura
¿Qué es XML?
XHTML: Extensible Hypertext Markup Language (lenguaje de marcas hipertexto ampliable).
● Es una versión de HTML compatible con XML.
XML: Extensible Markup Language (Lenguaje de marcas ampliable).
● Estándar del W3C que define una sintaxis genérica para marcar documentos con etiquetas de forma que sean
legibles por humanos.
El término marca de utiliza para indicar el significado de un carácter o un grupo de caracteres de
un documento.
● Permiten codificar texto electrónico para indicar el significado de una porción de texto mediante caracteres
especiales: los caracteres de marcado.
Por ejemplo, un texto en negrita se colocará entre las marcas de inicio y fin de negrita.
○ Esto es lo que hacen formatos como RTF o HTML.
Algunos lenguajes de marcas ya tienen caracteres de marcado predefinidos.
● XML es ampliable: permite crear marcas propias con un significado específico dentro de un documento.
● Proporciona la sintaxis necesaria para crear lenguajes de marcas a partir de la definición de sus propias
etiquetas.
● La flexibilidad le permite definir documentos de dominios muy distintos (datos bancarios, gráficos, vectoriales,
fórmulas matemáticas, datos de localización geográfica, noticias, etc.).
La sintaxis estándar permite que estos documentos sean explotados por programas que
interactúen, traten y manipulen la información contenida.
● Muchos lenguajes (como Java o .NET Framework) incluyen bibliotecas de clases para trabajar con datos XML
Universidad Pontificia de Salamanca. Escuela Superior de Ingeniería y Arquitectura
(CC) Luis Rodríguez Baena, 2013
2
¿Qué es XML?
Ventajas y utilidades
Ventajas de XML.
● Permite definir cualquier cosa, desde datos estructurados, documentos, gráficos, etc.
Sólo define la sintaxis del lenguaje.
● Es fácil de leer e interpretar.
● Ha sido diseñado para los protocolos de Internet.
Aunque también se utiliza en otros dominios (por ejemplo, en archivos de configuración).
● Es independiente de la aplicación y portable.
Se puede utilizar para traspasar datos de un lenguaje a otro, de una plataforma a otra, de una aplicación
a otra.
● Utiliza caracteres Unicode, lo que permite su adaptación a múltiples lenguas.
● La especificaciones son de libre uso.
Utilidades.
● Definición de formatos estándar de documentos.
Por ejemplo el formato OpenDocument (ODF), que se está adoptando por muchas administraciones o el
Open XML de Microsoft.
● Aplicaciones que necesitan almacenar datos de forma estructurada.
● Gestores de bases de datos.
● Persistencia de objetos para servicios Web.
● Transferencia de datos mediante HTTP en comercio electrónico, B2B, B2C.
● Migración entre distintas plataformas.
● …
Universidad Pontificia de Salamanca. Escuela Superior de Ingeniería y Arquitectura
(CC) Luis Rodríguez Baena, 2013
3
Lenguajes de marcas
Los lenguajes de marcas están formados por etiquetas
(marcas, tags, tokens) que especifican la apariencia o la
estructura de un documento.
La unión de las etiquetas y el texto forman el código
fuente del documento.
Ese código fuente puede ser código abierto o propietario.
● El formato de Word 2007 es código cerrado.
No se puede interpretar ni modificar si no es con aplicaciones
específicas.
● El formato RTF, HTML (o XML) es código abierto.
Puede entenderse y modificarse con herramientas estándar de edición.
Universidad Pontificia de Salamanca. Escuela Superior de Ingeniería y Arquitectura
(CC) Luis Rodríguez Baena, 2013
4
Lenguajes de marcas (II)
XML (y XHTML) están basados en SGML (Standard Generalized Markup
Language).
● Lenguaje desarrollado a finales de los años 70 para definir documentos de texto.
● Se utilizó en sectores que necesitaban administrar grandes volúmenes de
información (militar, aeroespacial, gubernamental).
● Fue el lenguaje elegido para aplicaciones que utilizaban los protocolos de Internet.
HTML está basado en SGML.
● Problema: excesivamente complicado.
En 1996 se planteó hacer una versión ligera de SGML que resolviera el
mismo tipo de problemas: definir documentos.
● En 1998 nace la especificación de XML 1.0.
XML es un lenguaje de “meta-marcas”.
● No tiene un conjunto fijo de etiquetas.
● Aporta la manera de definir etiquetas adaptadas a un dominio específico.
XML es un “meta-lenguaje”.
Se utiliza para definir otros lenguajes (como XHTML).
Universidad Pontificia de Salamanca. Escuela Superior de Ingeniería y Arquitectura
(CC) Luis Rodríguez Baena, 2013
5
Introducción
XHTML es una recomendación oficial del W3C que define una versión de
HTML compatible con XML.
● Redefine HTML como una aplicación XML.
HTML sería una versión SGML.
Ventajas que aporta.
● Al tratarse de documentos XML se pueden incorporar elementos de distintos
espacios de nombre.
Permite mezclar el documento con otros vocabularios XML, por ejemplo, incluir gráficos
vectoriales con SVG o expresiones matemáticas con MathML.
● Al tratarse de documentos bien formados los analizadores sintácticos se pueden
simplificar.
La libertad de HTML hace que su renderización en un navegador pueda ser más lenta.
● Al tratarse de documentos XML se pueden utilizar las mismas herramientas para el
tratamiento de los datos.
● Cómo XML, se trata de un lenguaje ampliable.
Es relativamente fácil añadir elementos al lenguaje a través de módulos.
Permite la interoperabilidad entre distintas plataformas y aplicaciones de usuario.
XHTML utiliza un conjunto de etiquetas similares a HTML.
● Pone algunas limitaciones al uso de etiquetas y atributos HTML que el W3C
considera obsoletos.
Universidad Pontificia de Salamanca. Escuela Superior de Ingeniería y Arquitectura
(CC) Luis Rodríguez Baena, 2013
6
Introducción
Documentos bien formados
Obliga a adaptar la escritura de las etiquetas y atributos del
documento a las restricciones del lenguaje XML.
El primer requisito de un documento XML es que debe
tratarse de un documento XML bien formado:
● Debe cumplir las especificaciones del lenguaje respecto a las reglas
sintácticas y tener una estructura jerárquica estricta.
1.
2.
Toda etiqueta de inicio debe tener una de cierre.
○
○
Si una etiqueta no tiene contenido debe tener también una etiqueta de cierre:
<etiqueta></etiqueta>
Una etiqueta sin etiqueta de cierre deberá acabar con la secuencia º.
<etiqueta />
Se pueden anidar elementos, pero no superponer ni mezclar.
Esta combinación no es posible en XHTML (aunque si en HTML).
○
<strong><em>Contenido</strong></em>
Se debería escribir así:
○
<strong><em>Contenido</em></strong>
Universidad Pontificia de Salamanca. Escuela Superior de Ingeniería y Arquitectura
(CC) Luis Rodríguez Baena, 2013
7
Introducción
Documentos bien formados (II)
Características de los documentos bien formados
(continuación).
3. Debe tener un único elemento raíz.
○
Un documento XML tiene una estructura de árbol, por lo que deberá
tener un único elemento raíz: el elemento html.
4.
Los valores de los atributos deben estar entrecomillados.
○
Un elemento XML puede tener atributos (características especiales del
elemento, como el URL de una imagen). El contenido de esos atributos
deberá ir entrecomillado.
<img src=“imagen01.png” alt=“casa” />
5. Un elemento no puede tener dos atributos con el mismo nombre.
6. No pueden aparecer signos < y & individuales dentro del contenido
de un elemento o atributo.
○
El signo < se utiliza para indicar el comienzo de una etiqueta, por lo que
no puede aparecer en el texto. En su lugar se utiliza la entidad <
(less than).
Por esa razón, tampoco se puede utilizar el carácter &, ya que sería el
comienzo de una entidad. En su lugar se utilizar &.
○
Universidad Pontificia de Salamanca. Escuela Superior de Ingeniería y Arquitectura
(CC) Luis Rodríguez Baena, 2013
8
Introducción
Documentos validados
Un documento validado es un documento bien formado en el que
sus elementos cumplen una serie de reglas.
● Esas normas pueden regular el número, nombre u orden de los elementos
o atributos o el contenido de los mismos.
● XML presenta dos mecanismos para asegurar esas reglas:
Definición del tipo de documento (DTD).
Esquemas XML.
Una DTD hace una descripción formal de un vocabulario XML.
● Determina:
Qué elementos (etiquetas) puede tener un documento.
Qué tipo de datos puede tener el contenido de una etiqueta.
Qué atributos y de qué tipo puede contener una etiqueta.
Qué jerarquía deben tener los elementos de un documento.
● Las DTD pueden ser compartidas por varios documentos.
● Permiten validar si esos documentos utilizan bien el lenguaje.
● La declaración del tipo de documento (DOCTYPE) en la cabecera de un
documento XHTML especifica que DTD utilizará ese documento.
Universidad Pontificia de Salamanca. Escuela Superior de Ingeniería y Arquitectura
(CC) Luis Rodríguez Baena, 2013
9
Introducción
Tipos de documentos XHTML
Los documentos XHTML deben ser
documentos válidos.
● Deben tener una declaración de tipo de
documento.
XHTML permite utilizar algunas de las
siguientes DTD.
● XHTML 1.0 Strict.
● XHTML 1.0 Transitional.
● XHTML 1.0 Frameset.
La elección de una u otra DTD para el
documento depende de:
● ¿El documento utilizará marcos?
● ¿Se van a utilizar elementos de
presentación dentro del propio
documento?
● ¿Se va utilizar CSS o algún tipo de hoja de
estilo para la presentación de la
información?
Universidad Pontificia de Salamanca. Escuela Superior de Ingeniería y Arquitectura
(CC) Luis Rodríguez
Comentarios de: 5. XHTML - Fundamentos de la Interacción Persona-Ordenador (0)
No hay comentarios