PDF de programación - Almacenes de Datos para la Web Semántica

Imágen de pdf Almacenes de Datos para la Web Semántica

Almacenes de Datos para la Web Semánticagráfica de visualizaciones

Actualizado el 7 de Septiembre del 2017 (Publicado el 4 de Septiembre del 2017)
1.276 visualizaciones desde el 4 de Septiembre del 2017
828,0 KB
103 paginas
Creado hace 15a (20/05/2008)
Almacenes de Datos para la Web

Semántica
Pablo de la Torre

Consorcio de la Zona Franca de Cádiz - 11011, Cádiz (Spain)

[email protected]

Supervised by Prof. Dr. D. Rafael Corchuelo Gil

Thesis project submitted to the Department of Computer Languages

and Systems of the University of Sevilla in partial fulfilment

of the requirements for the degree of Ph.D. in Computer Engineering.

(Research report)

Agradecimientos

Deseo agradecer a Rafael Corchuelo su dedicación, apoyo y ánimo en este
periodo formativo, así como durante todas las otras etapas anteriores en las que
he tenido la suerte de trabajar con él.

1

Resumen

El actual documento presenta un estudio detallado de las características de
nueve sistemas orientados al almacenamiento persistente, manipulación y con-
sultas de sentencias RDF, que se encuentran entre las iniciativas actuales más
representativas. Se pretende de esta manera completar otros trabajos relaciona-
dos mediante un examen, en mayor profundidad, de un conjunto de productos
amplio. Por cada sistema se describe, entre otra, información sobre licenciamien-
to, lenguaje de programación, tecnología, arquitectura, extensibilidad, API de
programación, estructura del almacén de datos, soporte de RDF/RDFS/OWL,
serialización, concurrencia, distribución, mecanismos de inferencia y lenguajes
de consulta. Si bien existen trabajos en conferencias y revistas sobre la filosofía
que subyace tras la Web Semántica, en escasas ocasiones son referidas las her-
ramientas que dan soporte al almacenamiento RDF, que en su mayor parte se
encuentran en estado de desarrollo no homogeneizado en cuanto a vocabulario
y objetivos, no existiendo un criterio ni marco de comparación común. Con la
misión de desarrollar un trabajo práctico, ha sido necesario complementar el
estudio de la documentación científica encontrada con diferentes páginas web
relativas a las propias herramientas de trabajo, lo que justifica la cantidad de
referencias web en la bibliografía. De esta manera, el objetivo de esta memoria
es por igual proponer un marco de comparación, en el que poner bajo la misma
perspectiva todas las herramientas estudiadas, y emplearlo para dar una visión
general de las características comunes del conjunto de herramientas analizadas,
de forma que se facilite una futura evaluación de las posibilidades en cuanto al
tratamiento y explotación de datos persistentes para la Web Semántica.

2

Índice general

1. Introducción

2. Hipótesis

2.1. Visión de la Web Semántica . . . . . . . . . . . . . . . . . . . . .
2.2. Almacenamiento, manipulación y obtención de datos . . . . . . .
2.2.1. Almacenamiento . . . . . . . . . . . . . . . . . . . . . . .
2.2.2. Manipulación . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.3. Obtención de datos . . . . . . . . . . . . . . . . . . . . . .
2.3. Eficiencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3. Estado del arte

3.1. Sistemas analizados . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2. Criterios de evaluación . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1. Datos básicos . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.2. Entorno . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3. Arquitectura . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.4. Extensibilidad . . . . . . . . . . . . . . . . . . . . . . . .
3.2.5.
Interacción . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.6. Modos de almacenamiento . . . . . . . . . . . . . . . . . .
3.2.7. Tratamiento de información . . . . . . . . . . . . . . . . .
3.2.8. Clasificación y relación . . . . . . . . . . . . . . . . . . . .
3.2.9.
Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.10. Consultas . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3. Sesame . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4. Jena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

12
12
14
15
15
16
18

20
20
21
21
21
22
22
22
22
23
24
25
28
29
35

3

3.5. AllegroGraph . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6. Redland . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7. 3store . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8. Virtuoso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.9. DLDB-OWL . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.10. SOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.11. Oracle Database 11g . . . . . . . . . . . . . . . . . . . . . . . . .

4. Conclusiones

I Apéndices

A. Subconjuntos de OWL

42
48
54
59
66
69
73

79

89

90

4

Índice de figuras

2.1. Arquitectura por capas de la Web Semántica . . . . . . . . . . .

14

3.1. Clasificación de almacenamiento persistente de ontologías
. . . .
3.2. Grados de complejidad de lenguajes de inferencia . . . . . . . . .
3.3. Arquitectura de Sesame . . . . . . . . . . . . . . . . . . . . . . .
3.4. Esquema de publicación de Sesame . . . . . . . . . . . . . . . . .
3.5. Arquitectura de Jena . . . . . . . . . . . . . . . . . . . . . . . . .
3.6. Esquema denormalizado de Jena . . . . . . . . . . . . . . . . . .
3.7. Tabla de propiedades Dublin Core en Jena . . . . . . . . . . . . .
3.8. Modelo ontológico en Jena . . . . . . . . . . . . . . . . . . . . . .
3.9. Arquitectura de AllegroGraph . . . . . . . . . . . . . . . . . . . .
3.10. AllegroGraph y RacerPro en la arquitectura de ontologías . . . .
3.11. Redland en la arquitectura de ontologías . . . . . . . . . . . . . .
3.12. Colaboración entre clases de Redland . . . . . . . . . . . . . . . .
3.13. Relación entre clases y bibliotecas de Redland . . . . . . . . . . .
3.14. Arquitectura de 3store . . . . . . . . . . . . . . . . . . . . . . . .
3.15. Esquema de publicación de 3store mediante Apache
. . . . . . .
3.16. Esquema de la base de datos en 3store . . . . . . . . . . . . . . .
3.17. Reglas de inferencia en 3store . . . . . . . . . . . . . . . . . . . .
3.18. Arquitectura de Virtuoso . . . . . . . . . . . . . . . . . . . . . .
3.19. Arquitectura de DLDB . . . . . . . . . . . . . . . . . . . . . . . .
3.20. Ejemplo de diseño de base de datos en DLDB-OWL . . . . . . .
3.21. Arquitectura de SOR . . . . . . . . . . . . . . . . . . . . . . . . .
3.22. Arquitectura de Oracle 11g . . . . . . . . . . . . . . . . . . . . .
3.23. Estructura de almacenamiento de Oracle 11g . . . . . . . . . . .

23
27
30
32
37
39
40
41
44
45
49
51
51
55
56
57
59
61
67
69
71
75
76

5

Índice de cuadros

. . . . . . . . . . .
3.1. Comparativa entre mecanismos de inferencia
3.2. Límites de sentencias en ediciones de AllegroGraph . . . . . . . .
3.3. Sistemas operativos soportados por AllegroGraph . . . . . . . . .
3.4. Hashes de Redland . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5. Soporte de inferencia para Oracle Database 11g . . . . . . . . . .

4.1. Comparativa en datos básicos . . . . . . . . . . . . . . . . . . . .
4.2. Comparativa en extensibilidad . . . . . . . . . . . . . . . . . . .
4.3. Comparativa en capacidades de interacción . . . . . . . . . . . .
4.4. Comparativa en modo de almacenamiento . . . . . . . . . . . . .
4.5. Comparativa en tratamiento de información (1 de 2) . . . . . . .
4.6. Comparativa en tratamiento de información (2 de 2) . . . . . . .
4.7. Comparativa en clasificación y relación . . . . . . . . . . . . . . .
4.8. Comparativa en modo y mecanismo de inferencia . . . . . . . . .
4.9. Comparativa en lenguajes de consulta . . . . . . . . . . . . . . .

28
43
43
50
78

81
82
82
83
84
85
86
87
88

6

Capítulo 1

Introducción

El objetivo de la Web Semántica es lograr que la información relativa a los re-
cursos existentes en la Web puedan procesarse automáticamente por máquinas.
Tales recursos no se centran en exclusiva en páginas HTML, sino que cualquier
información que circule por Internet debe ser “comprendida” por sistemas au-
tomáticos, ya sea contenido textual, servicios web, imágenes o incluso metadatos.
Respecto de estos datos procesados, la Web Semántica ha de obtener “conclu-
siones”, en la forma de contenido no explícito, bajo la demanda del usuario.

De esta manera, podría decirse que la Web Semántica es una tecnología
horizontal que abarca diferentes áreas de la informática; convergen aspectos rel-
ativos a la Inteligencia Artificial, las bases de datos, los conceptos ontológicos
y las comunicaciones. Así, para conseguir su objetivo es necesario la colabo-
ración de estas disciplinas aplicadas a diferentes conjuntos de información para
lograr: interoperatibilidad entre los datos, la capacidad deductiva derivada de
un uso óptimo de algoritmos razonadores sobre este conjunto de información, y
el almacenamiento y recuperación eficaz de todo lo procesado.

Esto no parece asunto sencillo, dado el volumen de información con el que
debe tratarse; en 2006, la información digital creada y procesada (no semánti-
camente) ascendía a 161 exabytes, o lo que es lo mismo, 161 000 millones de
gigabytes; esto equivale a unos tres millones de veces la información acumulada
en todos los libros jamás escritos. Se estima que entre 2006 y 2010 la información
digital se habrá multiplicado por seis, hasta llegar a 988 exabytes [54]. A esta
información en bruto, apenas relacionada y con una carencia remarcable en el
uso de sistemas de descripción de recursos, hay que añadir que la Web Semánti-
ca debe almacenar dichas descripciones, así como las relaciones (al menos las
explícitas) entre los diferentes datos. Si además se guardaran las interconex-
iones implícitas el volumen aumentaría considerablemente, si bien en beneficio
del coste de la consulta, pero en cualquier caso sobre modelos de inferencia que
en algunos casos ni siquiera garantizan computabilidad hoy en día.

El punto de partida y base para la definición de esta información es el

7

Lenguaje de Descripción de Recurs
  • Links de descarga
http://lwp-l.com/pdf6746

Comentarios de: Almacenes de Datos para la Web Semántica (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad