PDF de programación - Contenidos y metacontenidos en la edición digital

Imágen de pdf Contenidos y metacontenidos en la edición digital

Contenidos y metacontenidos en la edición digitalgráfica de visualizaciones

Publicado el 6 de Marzo del 2017
642 visualizaciones desde el 6 de Marzo del 2017
398,2 KB
26 paginas
Creado hace 20a (14/01/2004)
[Publicado en Letras de Deusto 100:11-52, julio-septiembre 2003.

Nota: la paginación en esta versión electrónica no coincide con la de la edición impresa.]

Contenidos y metacontenidos en la edición digital

Joseba Abaitua, Guillermo Barrutieta, Josuka Díaz, Inés Jacob, Fernando Quintana

Grupo DELi

www.deli.deusto.es
Universidad de Deusto

Resumen

Los lenguajes de anotación basados en SGML/XML han propiciado un cambio revolucionario
en los métodos de edición tradicional y constituyen el fundamento de la edición digital moderna. El
artículo define los conceptos de metadato y metacontenido y reseña las principales iniciativas actuales de
gestión de metacontenidos. En el campo filológico se introduce TEI; en el área de Internet se habla de
DCMI, RDF, así como de la web semántica; en el terreno de la traducción se citan TMX y XLIFF; y, por
último, en el ámbito de la recopilación y sindicación de metacontenidos, se presentan OCS y OAI. De
esta manera, el artículo ofrece un repaso amplio y representativo de las principales líneas de actuación en
la gestión de contenidos y metacontenidos en el marco de la edición digital.

1 Introducción

En el desarrollo de las técnicas de edición digital modernas se recogen aportaciones procedentes de
disciplinas como la filología, la lingüística, la informática, o la biblioteconomía y todas ellas confluyen
en el uso del metalenguaje SGML/XML. La evolución de los procesadores de texto y de otras
herramientas de maquetación digital, que representan el área más visible de convergencia entre la
informática y el trabajo editorial, ofrecía hasta fechas recientes resultados decepcionantes (con la única
excepción del sistema de edición basado en TeX/LaTeX, de Knuth, 1984). Sowa (2000) lo expresa de esta
manera:

Por desgracia, la mayoría de los procesadores de texto sólo abarcan un subconjunto pequeño de
la sintaxis y han producido lo que St. Laurent (1999) llama el desastre de WYSIWYG: "El texto
plano, por muy tosco que pueda parecer, es mucho más manejable que el resultado de un
procesador de texto o maquetador cualquiera". En la práctica, el eslogan "What you see is what
you get" significa en realidad WYSIAYG: "What you see is all you get." El texto está tan
sobrecargado con códigos de formato que no queda sitio para la semántica o la pragmática. El
formato Rich Text Format (RTF) es paradójicamente la forma de representación semántica de
texto más pobre que existe. El formato es un aspecto del texto que lo hace parecer bonito, pero
que falla en lo cuestión fundamental de lo que significa..

Por fortuna, a finales de la década de los ochenta se diseñó SGML con unos postulados innovadores en el
terreno del tratamiento documental. Para empezar, SGML expresa de manera clara la separación entre
formato y contenidos, lo que permite tratar el problema del significado de manera independiente. La
gestión de contenidos es precisamente el aspecto que más se beneficia de las tecnologías de la
información. Veremos en este artículo las importantes consecuencias que ello conlleva en el marco
general de la edición y publicación de textos electrónicos; sobre todo a partir de la explosión de
contenidos propiciada por la web.

El segundo apartado de este artículo aborda una serie de conceptos básicos que son necesarios para
comprender mejor las implicaciones de los nuevos enfoques de la edición digital. Se reseñará XML,
sucesor directo de SGML, como metalenguaje estándar y fundamento de toda la actividad actual. Junto a
XML se explicarán las nociones de metalenguaje y metadato. En el tercer apartado se introducirá el
principal hito en el uso de metacontenidos en el terreno filológico, la Text Encoding Initiative (TEI). Pero
TEI no agota el abanico de actividades y por ello en el apartado cuarto se presentan otras iniciativas de
metadatos que han surgido en el área de Internet: DCMI, RDF y la web semántica. El apartado quinto se
ocupa de dos estándares para el intercambio de información en el campo de las traducciones: TMX y

XLIFF. Por último, en el apartado sexto se describen iniciativas para la recopilación y sindicación de
metacontenidos, OCS y OAI, que representan un área de actividad que tendrá mucho que aportar en los
próximos años.

De esta manera, el artículo ofrece un repaso amplio y representativo de las principales líneas de actuación
en la gestión de contenidos en el marco de la edición digital.

2 Conceptos preliminares

Antes de abordar las que consideramos principales líneas de acción en el panorama actual de la edición
digital, vamos a repasar algunos conceptos básicos que ayudarán a comprender mejor la dimensión e
implicaciones de los nuevos enfoques. Vamos a presentar XML, el metalenguaje estándar y fundamento
de toda la actividad actual. Junto a XML expondremos también las nociones de metalenguaje y metadato.

Lenguajes y metalenguajes

Siempre que estudiemos el lenguaje, en cualquiera de sus modos (oral, escrito o electrónico), estaremos
elevando el discurso a un plano que por definición denominaremos metalenguaje. La lingüística, por lo
tanto, como ciencia del lenguaje humano se sitúa por vocación propia en el plano de los metalenguajes.
Algo similar sucede con la filología, ciencia que estudia los resultados o productos del lenguaje humano;
por ello, los estudios que se realicen sobre los textos (estén en el soporte que estén) se plantearán en un
plano más elevado de metatexto. En la bibliografía especializada y también en este artículo, los términos
técnicos de “metalenguaje” o “metatexto” se reemplazarán con frecuencia por los más comunes de
“texto” y “lenguaje”.

El desarrollo de tecnologías basadas en metalenguajes tiene especial relevancia para el tratamiento
computacional del lenguaje, así como para otros aspectos básicos del procesamiento de textos. Los
avances han venido marcados por la evolución de los lenguajes lógicos, formales o simbólicos. Los
orígenes del simbolismo se remontan a la Grecia clásica y suelen relacionarse con la aportación del
matemático griego Euclides, del siglo IV a.C. En su obra Los elementos, este autor desarrolló lo que hoy
en día se conoce como geometría euclídea, un estudio formal de conceptos geométricos elementales
(puntos, líneas, superficies, polígonos y otras figuras). El hecho relevante es que Euclides fue capaz de
expresar estos conceptos mediante un lenguaje de estructura lógica. Sobre la base de un conjunto de
definiciones iniciales, nociones comunes y axiomas o postulados, se deducían el resto de proposiciones.
De esta manera, sentó los fundamentos de una disciplina matemática, la geometría, que en esencia se ha
mantenido inalterada hasta finales del siglo XIX.

La geometría euclídea se formuló en una lengua natural, el griego, que sirvió de esta manera de
metalenguaje. Euclides como Aristóteles fue discípulo de Platón y ambos formaron parte de una sociedad
que empezaba a exteriorizar las consecuencias de una nueva tecnología: la escritura alfabética. La idea de
que la generalización de la escritura alfabética fue la causa de importantes cambios en el desarrollo
cognitivo y cultural de la Grecia clásica es una hipótesis avanzada por Havelock (1963) y luego reforzada
por Ong (1982). De acuerdo con esta hipótesis, las aportaciones de Aristóteles en todos los campos, pero
muy especialmente en lógica, así como las de Euclides en matemáticas, serían consecuencia directa de las
transformaciones en la manera de aprender y de pensar propiciadas por la escritura alfabética (Ong,
1982):

Writing makes it possible to separate logic (thought structure of discourse) from rhetoric
(socially effective discourse). The invention of logic, it seems, is tied not to any kind of writing
system but to the completely vocalic phonetic alphabet and the intensive analytic activity which
such an alphabet demands of its inventors and subsequently encourages in all sorts of noetic
fields.

En la evolución de las tecnologías aplicadas al pensamiento humano destaca la invención de Ramón Llull
de un artilugio lógico en pleno siglo XIII. En aquellos años de la baja edad media, la Europa cristiana
vivía una gran efervescencia proselitista frente al Islam. En este contexto, el autor del Ars magna tuvo la
audacia de diseñar una máquina de pensar en la que las proposiciones teológicas adquirían formas
geométricas que, manipuladas mediante poleas y manillas, probaban mecánicamente su veracidad o
falsedad.

La obra de Llull tuvo un eco moderado en el desarrollo de la filosofía. Leibniz, tres siglos después,
rescataba este legado con un nuevo método que trataba de expresar con precisión los razonamientos de la
filosofía, el calculus ratiocinator. Suponía un nuevo intento de construir un sistema de pensamiento
lógico inspirado en los lenguajes matemáticos y alejado de la ambigüedad del lenguaje natural.

Pero no será hasta el siglo XIX cuando George Boole y Gottlob Frege por fin consiguen establecer las
bases de los lenguajes formales actuales. En su obra Laws of thought de 1854, Boole formuló un álgebra
lógica similar en rigor y exactitud al álgebra de las matemáticas. Mientras, la Begriffsschrift (o
Ideografía, 1879) de Frege, con el sugerente subtítulo de un lenguaje formalizado del pensamiento puro a
base del lenguaje aritmético (Ferrater 1991), marca indudablemente tanto el comienzo de la lógica
moderna (mostrando además que la matemática se reduce a ésta), como el uso de los lenguajes simbólicos
o formales. A pesar de no tener relación directa con el concepto de metalenguaje, no podemos dejar de
mencionar el trabajo fundamental de Kurt Gödel, que en 1931 dio la vuelta a la lógica demostrando,
primero, que ésta se reduce a la aritmética, y después, que era incapaz de servir al sueño de Llull, Leibniz,
Frege, Hilbert y tantos otros de alcanzar todas las verdades universales.

Todos los formalismos gramaticales que se utilizan en la actualidad para expresar generativamente, es
decir, con precisión, la sintaxis o la semántica de las lenguas naturales (HPSG,
  • Links de descarga
http://lwp-l.com/pdf2538

Comentarios de: Contenidos y metacontenidos en la edición digital (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad