PDF de programación - Tecnologías XML y Web Semántica

Imágen de pdf Tecnologías XML y Web Semántica

Tecnologías XML y Web Semánticagráfica de visualizaciones

Publicado el 18 de Junio del 2018
153 visualizaciones desde el 18 de Junio del 2018
568,0 KB
29 paginas
Creado hace 13a (23/07/2006)
Tecnologías XML y Web Semántica

Departamento de Informática

Universidad de Oviedo

Antes de empezar…

Lo siento, pero No váisa aprender Tecnologías XML y Web Semántica

…en 1 semana

Objetivo: Conocer las tecnologías y para quésirven

1

Índice

Repaso de conceptos

Internet
Unicode
URIs

Lenguaje XML

Documentos bien formados
Documentos válidos: DTDs

Vocabularios XML

XHTML, MathML, SVG, SMIL, X3D, VoiceXML, …

Internet
Evolución

(60-80) Origen militar

Protocolos de comunicación (TCP/IP)
Seguridad ante ataques (múltiples servidores)

(80 – 95) Implantación académica

Protocolos de intercambio de información (FTP, SMTP, HTTP, ...)
Enorme biblioteca con material hipermedia

(95 – 00) Acceso comercial

Posibilidad de negocio ⇒ Dinero!!
Boom comercial

(00 – 05) Crisis de las punto com

Historias de fracasos ⇒ Lecciones aprendidas
Revisión de arquitecturas tradicionales

(05 – ?) Nuevos retos

Múltiples dispositivos, Automatización de tareas, Acceso universal
¿Web 2.0?

2

Internet

Modem

ISP local

Router

ISP regional

Acceso particular

servidores

Telefonía móvil

Acceso corporativo

wireless

Internet
Repaso de conceptos

IP (Internet Protocol) protocolo de intercambio de paquetes

Asigna direcciones globales únicas (32 bits)
IPv6: nueva versión propuesta (direcciones de 128 bits)

Host = nodo de la red (con dirección IP)
Cliente: Ordenador que solicita servicios
Servidor: Ordenador que propicia respuestas a los clientes
Además de la dirección IP, el puerto (16bits) identifica el servicio
Varios puertos predefinidos (80 = HTTP, 25 = SMTP, 20/21 = FTP, etc.)

Protocolo TCP: Comunicación entre nodos manteniendo una conexión.

En condiciones normales, todos los paquetes llegan
Servicio de transporte y control de congestiones
No se garantizan tiempos ni retardos mínimos
Se utiliza para transmitir correos, ficheros, etc.

Protocolo UDP (Datagrama) no se realiza una conexión

Pueden producirse pérdidas de algunos paquetes
Utilizado para transmisión de voz

3

Internet
Principales Protocolos

HTTP: Protocolo de transferencia de hipertexto

Puerto 80
Utiliza TCP/IP como protocolo subyacente
No incluye estado (no se almacena información del cliente)
HTTP/1.1 proporciona conexiones persistentes

FTP: Transferencia de ficheros

Puertos 20/21
Mantiene estado

SMTP (simple mail transfer protocol)

Formato de mensajes mediante MIME
Protocolos de acceso (POP3, IMAP, etc.)
DNS: Asignación de nombres de dominio
Otros: LDAP , NNTP, WebDAV, etc.

World Wide Web
Evolución

Hipertexto (Ted Nelson, 1965)

Texto no secuencial, con enlaces

WWW (Tim Berners-Lee, 1989)

Protocolo HTTP (Hypertext transfer protocol)

Se basa en Internet
Arquitectura cliente/servidor

Lenguaje HTML (HyperText Markup Language)

Enlaces mediante URLs
Marcas

Símbolos extras que se añaden al texto ordinario
Modifican la representación del texto por parte del explorador

World Wide Web: Red de ordenadores que se comunican mediante el

protocolo HTTP

4

Arquitectura cliente/servidor

World Wide Web
Arquitectura

Cliente

Protocolo

http

Servidor

Visualizador

GET http://servidor.com/hola.html

http:/1.0 200 OK
http:/1.0 200 OK
<html>
<html>
<body>
<body>
Enlace a
Enlace a
<a href =“otro.html”>Otro</a>
<a href =“otro.html”>Otro</a>
</body>
</body>
</html>
</html>

World Wide Web
Características

WWW = Mayor almacen de información jamás recopilado por la

humanidad
Características

Grandes cantidades de información sobre cualquier asunto
Acceso casi instantáneo desde cualquier lugar con conexión a

Internet

Sistema no centralizado ⇒ Cualquier persona puede añadir más

información

Plataforma Multimedia (Texto, Imágenes, Vídeo, etc.)
Identificación de recursos unificada (URIs)

5

World Wide Web
Grandes Retos

Integración de aplicaciones

Búsqueda de lenguajes comunes: Estandarización
Interoperabilidad y computación ubicua
Modelos Orientados a Servicios

Automatización de tareas

Representaciones comprensibles por las máquinas
Creación de agentes autónomos

Accesibilidad

Acceso universal
Atención a todos los usuarios: discapacidades, entornos diferentes, etc.

Datos

Datos

Docum.
auto-

descrito

Lógica

Ontologías

RDF + RDF Schema

XML + Namespaces + XML Schema

Unicode

URI

World Wide Web
Arquitectura propuesta

Reglas

Confianza

Demostración

s
e
l
a
t
i
g
d

s
a
m

i

r
i
F

6

Representación de Información
Bits, bytes, números, caracteres, ...

Los ordenadores manejan código binario: 0s y 1s

Bytes: Grupos de 8 bits

Números: Sistemas de codificación binaria, octal, hexadecimal...
Caracteres: Código que asocia a cada carácter un nº

ASCII: 7 bits ⇒ (0 – 127)

(A)merican (S)tandard (C)ode for (I)nformation (I)nterchange

Extensiones de ASCII

ISO-8859-1 (iso-latin-1)

(8 bits) ASCII (0-127) + otros caracteres típicos de Europa occidental

Familia ISO-8859-X = Otros alfabetos europeos
ISO-8859-15 (iso-latin-9) Igual que iso-8859-1 + símbolo de €

¡CUIDADO! ...hay muchos idiomas y muchos caracteres...

ℜ € き ㄝ ㌟ ㉃ ⋐ ∀ ℵ ₤ ウ ぼ

Unicode

ISO-10646 (31 bits) Define un repertorio universal de caracteres (UCS)

En continua revisión: ISO-10646-2:2001 contiene más de 70.000 caracteres

UNICODE = Consorcio de empresas que define restricciones sobre la

implementación de ISO-10646

Varias codificaciones (UTF = Unicode Transformation Format)
- UTF-8: Los primeros 127 códigos se presentan igual (compatible con ASCII)

El resto se codifican en longitud variable
Relativamente Eficiente

- UTF-16: Usa 16bits para los caracteres más comunes, el resto con pares de 16

bits

- UTF-32: Codificación directa en 32 bits (desperdicio de espacio)

Se distingue entre:
Carácter: Entidad abstracta (Letra A)
Glifo (Glyph): Representación del carácter A A A A A A
Fuente (Font): Conjunto de glyphs, ejemplo: Times Roman, Arial, etc.

7

Información multimedia

Imágenes: En pantalla = matriz de puntos de colores (pixels)
Formatos Raster (Raw): Se enumeran todos los puntos con sus

colores
Ejemplo: Bitmap, TIFF

Compresión: diversos algoritmos de compresión

GIF: Utiliza 8 bits (hasta 256 colores)

Byte de color = Indice en la paleta de colores

JPEG: utiliza 24 bits (hasta 16 millones de colores)
Vectorial: Se enumeran las instrucciones de dibujo

Ejemplos: DXF, SVG (estándar de Internet)

Sonido: Formatos raster (WAV) y comprimidos (MP3)
Vídeo: Formatos comprimidos (MPEG)
Realidad Virtual: Lenguaje de Modelado (VRML, X3D)

Identificación Recursos

URI: (Uniform resource Indentifier) Identifica un recurso de forma global
Puede sub-clasificarse en:

URL (Uniform resource locator)

Además de identificar el recurso, indica cómo llegar hasta él

esquema: //servidor:puerto /ruta?datosGET
http://www.uniovi.es:8080/prueba/carrito?action=print

URN (Uniform resource name): Nombre de recurso

Ejemplo: urn:xmlorg:objects:schema:xmlschema:xcatalog

IRIs (Internationalized Resource Identifiers)
permiten utilizar caracteres Unicode en los identificadores

URLs

URNs

URIs

8

Lenguaje XML

Orígenes de XML
Marcado de documentos

Orígenes: Industria de la Publicación
Uso de marcas = indica cómo componer documento para impresión

Ejemplo de corrección tipográfica
Fuente: http://recursos.cnice.mec.es/bancoimagenes

9

Marcado de documentos

Sólo texto
ALBA Abril de 1915 Granada Mi corazón oprimido
siente junto a la alborada el dolor de sus
amores y el sueño de las distancias.

Texto marcado
]ALBA[ ← Título, negrita, centrado, 14pt
]Abril de 1915[← SubTítulo, negrita, centrado
]Granada[← SubTítulo cursiva, centrado
]Mi corazón oprimido [← Verso, 10pt
]siente junto a la alborada [← Verso
]el dolor de sus amores [← Verso
]y el sueño de las distancias. [← Verso

Resultado
ALBA

Abril de 1915

Granada

Mi corazón oprimido
siente junto a la alborada
el dolor de sus amores
y el sueño de las distancias.

Marcado Descriptivo

El marcado no es la información que contiene el documento
Marcado = información acerca del documento = meta-información
Lenguajes de Marcado descriptivo: Incluyen marcas que describen cómo

procesar el documento
Ejemplo: HTML

<html>
<head><title>Poema</title></head>
<body lang=“es”>
<h1>Alba</h1>
<h2>Abril de 1915 </h2>
<h2><i>Granada</i></h2>
<p>Mi corazón oprimido</p>
<p>siente junto a la alborada</p>
<p>el dolor de sus amores</p>
<p>y el sueño de las distancias. </p>
</body>
</html>

10

Marcado Generalizado

Marcado generalizado = Sintaxis común que facilita la creación de

lenguajes descriptivos

HTML

<html>
<head><title>Poema</title></head>
<body lang=“es”>
<h1>Alba</h1>
<h2>Abril de 1915 </h2>
<h2><i>Granada</i></h2>
<p>Mi corazón oprimido</p>
<p>siente junto a la alborada</p>
<p>el dolor de sus amores</p>
<p>y el sueño de las distancias.</p>
</body>
</html>

Otras marcas...(misma sintaxis)
<poema fecha="Abril de 1915"

lugar="Granada">

<titulo>Alba</titulo>

<verso>Mi corazón oprimido</verso>
<verso>siente junto a la alborada</verso>
<verso>el dolor de sus amores</verso>
<verso>y el sueño de las distancias. </verso>
</poema>

Sintaxis común
<etiqueta atrib=“valor”>contenido
</etiqueta>

Marcado Generalizado
SGML

(70- ) GML desarrollado en IBM – Generalized Markup

Language (Goldfarb, Mosher, Lorie)

(86) SGML Standard Generalized Markup Language

(Estándar ISO)
Utilizado para el intercambio de documentos
Principio: Separar contenido de la forma de

representarlo

Muy flexible (permite definir vocabularios específicos

para cada aplicación)

HTML era un vocabulario de SGML

11

Marcado Generalizado
XML

Desarrollado por T. Bray, J. Paoli, C. M. Sperberg-McQueen (1995)

T. Bray: Consultor de Textuality para Netscape (ahora en Sun)
C. M. Sperberg-McQueen (TEI, SGML)
J. Paoli (Microsoft)

Objetivos:

Crear una versión simplificada de SGML para la Web

20% de características de SGML ⇔ 80% de funcionalidad de SGML
Detalle (Especificación de XML = 26 páginas, de SGML > 500

XML

<?xml version=“1.0” ?>
<!DOCTYPE raíz[
]>



<raíz>

</raíz>

<elemento>
</elemento>

Declaración de

XML

Declaración de

Tipo DTD
Opcio
  • Links de descarga
http://lwp-l.com/pdf11953

Comentarios de: Tecnologías XML y Web Semántica (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios
Es necesario revisar y aceptar las políticas de privacidad