PDF de programación - Biblioteca Digital y Web Semántica

Imágen de pdf Biblioteca Digital y Web Semántica

Biblioteca Digital y Web Semánticagráfica de visualizaciones

Publicado el 14 de Enero del 2017
746 visualizaciones desde el 14 de Enero del 2017
88,7 KB
18 paginas
Biblioteca Digital y Web Semántica

Carolina García Cataño y David Arroyo Menéndez

Copyright (c) 2002 David Arroyo Menéndez, Carolina García Cataño Se otorga permiso para copiar, distribuir,
y/ó modificar este documento bajo los términos de la GNU Free Documentation License, Version 1.1 ó cualquier
versión posterior publicada por la Free Software Foundation; sin secciones invariantes, ni textos de portada, ó
contraportada Una copia de ésta licencia es incluida la sección titulada "GNU Free Documentation License"

Tabla de contenidos

Introducción . . 1
Edición electrónica . . 2
Introducción a la biblioteca digital . . 4
Web semántica . . 5

Elementos básicos de la web semántica . . 5
La recuperación de la información en la web semántica . . 7

Licencias . . 8

Evolución del copyright . . 8
Explicación y ventajas de la licencia gfdl . . 9

Proyectos . . 11

GNU Free Documentation Database (GFDD) . . 11
Biblioweb en SD . . 11
Wikipedia/Gnupedia . . 12

GNU Free Documentation License . . 13

PREAMBLE . . 13
APPLICABILITY AND DEFINITIONS . . 13
VERBATIM COPYING . . 14
COPYING IN QUANTITY . . 14
MODIFICATIONS . . 15
COMBINING DOCUMENTS . . 16
COLLECTIONS OF DOCUMENTS . . 16
AGGREGATION WITH INDEPENDENT WORKS . . 16
TRANSLATION . . 17
TERMINATION . . 17
FUTURE REVISIONS OF THIS LICENSE . . 17
How to use this License for your documents . . 17

Introducción

Desde el principio de los tiempos parte de la humanidad se ha preocupado por almacenar y compartir el saber desde
las primitivas pinturas rupestres, pasando por la escritura, imprenta, dispositivos para almacenar audio, vídeo, etc.
la llegada de ordenadores supuso un hito en cuanto que su capacidad de almacenamiento y procesamiento de
la información hizo prever posibilidades hasta entonces inimaginables, la llegada de las redes de información e
Internet evidenciaron que el poder de la información puede llegar a generar sistemas informáticos completos con la
voluntariedad desinterasada de un incontable número de programadores, generar empresas punteras desde garajes,
hacer temblar mercados internacionales por las travesuras de un quinceañero y otros sucesos que mantienen viva
nuestra capacidad de sorprendernos. Y, sin embargo, quienes escribimos este artículo pensamos que lo mejor está
aún por llegar...

También desde el principio el acceso a la información ha marcado la diferencia entre ricos y pobres, poderosos
y desheredados, entre ganar y perder una guerra... La información tiene y ha tenido un papel protagonista en la

1

Biblioteca Digital y Web Semántica

práctica totalidad de sistemas sociales que han existido durante la historia en las sociedades primitivas era el viejo
(el sabio) el que gobernaba, en la Edad Antigua el Imperio Romano se alzó ante las sociedades que convivían en el
mediterráneo absorviendo como una esponja lo mejor de cada cultura, el cristianismo se fundamenta en un libro:
la Biblia, los musulmanes tienen el Corán, la Baja Edad Media supuso un retraso con respecto a la edad antigua
debido a que el saber se subordinó a intereses políticos y religiosos.

En el siglo XV, con la imprenta de Gutteberg, llegó lo que se podría llamar la primera revolución de la
"Información", por primera vez en la historia el pensamiento humano, la facilidad con que de repente se podían
hacer los libros perjudicó a las congregaciones religiosas que hasta el momento tenían el monopolio de la
confección de libros. La imprenta se implantó en los distintos países europeos rápidamente, teniendo como
principal consecuencia el facilitar acceso público al conocimiento hasta entonces sólo al alcance de algunos
privilegiados, el pensamiento humano se empezaría a difundir con mayor libertad. El libro ha ido evolucionando a
lo largo de sus años de existencia, por ello no debemos olvidar toda la evolución en la organización y presentación
de los libros, comos son los índices, el fragmentar los textos en capiítulos, secciones, párrafos, etc. el tamaño, las
tipografías, las notas, bibliográficas; todo esto que ahora nos parece evidente es fruto del pensamiento humano
durante mas de 500 años, en estos momentos, de hecho muchas de estas problemáticas resueltas en los libros
impresos no estan del todo resueltas para los formatos digitales.

La Ilustración que promulgaba el acceso al saber provocó la revolución francesa, los llamados países comunistas
hacían bandera de la educación de las masas y las sociedades occidentales de la libertad de prensa, cualquier
regimen totalitario tiene el control absoluto de los medios de comunicación, ... Podríamos escribir hasta el infinito
acerca de la importancia histórica del acceso a qué información, pero no es el objeto de este artículo.

Siempre se habla de acceso a la información, no puede ser de otro modo, en el momento en que dejamos de
movernos por instinto y racionalizamos las cosas es información lo que gobierna nuestras acciones, de hecho,
incluso nuestros instintos y características físicas no son otra cosa que información genética, información,
información, información ¿puede la información ser libre? Ésta es una pregunta compleja que requeriría un
estudio profundo acerca de lo que es la información y lo que es la libertad. En este artículo tan sólo se pretende
hablar acerca de la libertad en una de las múltiples formas que adopta la información: la documentación escrita.

Hoy por hoy es el lenguaje humano la forma de comunicación que gobierna en mayor medida la información que
racionalizamos los seres humanos; el acceso a los contenidos descritos en este lenguaje y la capacidad de inferencia
automática que se pueda hacer a través de Internet a partir de estos contenidos es el objeto de este artículo titulado
Biblioteca Digital y Web Semántica dos conceptos que se entremezclan hasta tal punto que pronto serán uno sólo
pero aún hoy deberemos tratar por separado.

Edición electrónica

Para entender algunas de las licencias y la realidad que subyacen en bibliotecas digitales y lo que será la web
semántica, debemos empezar entendiendo los formatos más habituales por los que el texto ha pasado por nuestros
ordenadores. Esto es lo que se tratará en esta sección.

1. txt: Todos los procesadores de texto lo entienden y ocupa poco, pero esta bastante limitado en cuanto a lo
que se puede mostrar, de hecho no se puede hacer ni una pobre cursiva. No separa lo que es presentacion de
contenido, pero es que no hay nada que presentar :D

2

Biblioteca Digital y Web Semántica

2. html: Todos los navegadores lo entienden, lo cual quiere decir que ademas se puede navegar mediante
el, lo cual permite leer de una manera mas cercana a como se piensa, mediante un monton de enlaces
(asociaciones). El problema de este formato es que tambien esta bastante limitadito. Por ejemplo, queremos
tener en nuestro documento una ecuacion matematica pues no nos queda mas remedio que meter una imagen,
lo cual ya no mola porque nuestra pagina ya va a tardar en cargar, entonces en nuestra ecuacion nos damos
cuenta de que en vez de un 2 queremos meter un 3, pues entonces tienes que modificar la imagen lo cual
es un engorro, pero si tuvieras que modificar 20 imagenes ya seria algo realmente terrible. Y todo porque
html no es una ecuacion. Este ejemplo es extrapolable a muchos mas casos pero creo que este es bastante
ilustrativo, ya que todos hemos tenido que manejar las matematicas en nuestros estudios y muchos seguimos
haciendolo.

Este lenguaje (si es que puede llamarse asi) hacer un intento realmente popular de separar lo que es
presentacion de contenido, ya que por un lado nuestrofichero.html al abrirlo con un editor de textos lo vemos
con sus etiquetitas, nosotros se las colocamos debidamente a nuestros contenidos y luego si pasamos hojas
de estilo y demas ... bueno se separa bastante lo que hay de lo que se muestra.

Pero en la practica a nadie le importa si hemos etiquetado correctamente el contenido o si deberiamos haber
utilizado una hoja de estilo, tan solo importa como lo vea mi navegador y los navegadores comerciales
interpretan las hojas de estilo y las etiquetas a su manera ?resultado? La gente coge el Word o el FrontPage? y
genera sus paginas en plis plas, pero mediante un seudo-html que solo entiende bien el Explorer de Microsoft,
en fin el html pierde su universalidad de esta manera tan tonta.

3. tex:

latex es un lenguaje de marca (como html) donde se generan ficheros de extensión .tex lleva utilizándose
mucho tiempo en entornos académicos. Este lenguaje tiene una expresividad brutal, separa perfectamente lo
que es la presentación del contenido y no tendremos ningún problema para incluir ecuaciones matemáticas.
Además siempre podremos pasarlo de manera automática a otros formatos más sencillos como txt o html, o
a otros orientados a la visualización y que ocupan muy poco como pdf, gv, dvi, ps, etc. Un gran editor para
este lenguaje de marca es Emacs y como editor visual Lyx.

4. xml: Es un metalenguaje, un lenguaje para escribir lenguajes. Hablamos mas en profundidad mas adelante,
por ahora, solo decir que que un documento escrito en un lenguaje xml puede pasarse a todos los formatos
que hemos descrito en latex y ademas a bases de datos debido al hecho de que todas las etiquetas en xml,
se cierran. Ademas, es facil hacer un nuevo lenguaje xml basta con escribir una dtd que es un fichero donde
definimos que etiquetas tendra nuestro lenguaje y una xsl para ver como se transformaran las etiquetas y si
los entusiastas del xml tienen razon algun dia todos los navegadores podran procesar estas etiquetas y estas
transformaciones, pues parece que tiene bastante futuro. El lenguaje xml que por ahora se esta usando para
documentar es docbook que, en cuanto a posibilidades es bastante similar a latex.

5. doc: Los famosos .doc que tantas pasiones levantan en Internet y su omnipresente word. Muchas personas
se preguntan que porque los usuarios de esos sistemas que llaman libres los .doc tienen tanta mania a este
formato el caso es que los .doc tienen un formato compilado
  • Links de descarga
http://lwp-l.com/pdf31

Comentarios de: Biblioteca Digital y Web Semántica (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios
Es necesario revisar y aceptar las políticas de privacidad