PDF de programación - Gestión de traducciones mediante metadatos TEI y XLIFF

Imágen de pdf Gestión de traducciones mediante metadatos TEI y XLIFF

Gestión de traducciones mediante metadatos TEI y XLIFFgráfica de visualizaciones

Publicado el 24 de Abril del 2017
635 visualizaciones desde el 24 de Abril del 2017
169,5 KB
10 paginas
Creado hace 20a (24/09/2003)
Gestión de traducciones mediante metadatos TEI y XLIFF1
Josuka Díaz Labrador, Inés Jacob Taquet, Fernando Quintana Hernández

Facultad de Ingeniería, Universidad de Deusto

Apartado 1 - 48080 BILBAO

(josuka, ines, fquintan)@eside.deusto.es

Joseba Abaitua Odriozola

Facultad de Filosofía y Letras, Universidad de Deusto

Apartado 1 - 48080 BILBAO

abaitua@fil.deusto.es

Garikoitz Araolaza

CodeSyntax

BIC-Berrilan. Azitain Poligonoa P3 E2. 20600 EIBAR

[email protected]

Guillermo Barrutieta

Facultad de Ingeniería, Mondragon Unibertsitatea
Loramendi, 4 Apartado 23 - 20500 - Mondragon

[email protected]

Resumen: Esta comunicación describe la utilización de metadatos en el sistema
de gestión de traducciones SARE-Bi. Los metadatos desempeñan un papel clave en
el control de todas las fases del ciclo de vida de los documentos, desde la primera
versión de borrador, hasta la reutilización ulterior del documento publicado, pasando
por las etapas intermedias de traducción, revisión, validación, publicación, etc. La
implementación se ha desarrollado sobre el servidor Zope de publicación para la web,
a partir de las propuestas XML de TEI, para la anotación de copora textuales, y
XLIFF, para el control de versiones. Se demostrará que Zope es una herramienta
adecuada para la gestión de los contenidos en todo su ciclo de vida.
Palabras clave: gestión de contenidos multiling¨ues, metadatos, XML, TEI, XLIFF,
Zope, traducción asistida por ordenador

Abstract: This paper describes the translation managing system SARE-Bi based
on metadata. In this system, metadata have the role of controlling all phases of a
document’s life cycle, from the drafting of the first version up to the reutilization
of published material, including all intermediate phases of translation, post-edition,
validation, publication, and others. The system has been implemented in the web
applicaiton server Zope and metadata are based on two XML proposals: TEI, for
structural markup, and XLIFF, for log control. The paper shows how adequate Zope
is as an application to manage the entire life cycle of multilingual contents.
Keywords: multilingual document management, metadata, XML, TEI, XLIFF,
Zope, computer assisted translation

1.

Introducción

Uno de los inconvenientes más severos
para incorporar la traducción automática a
un entorno de publicación multiling¨ue es
su incapacidad para detectar los factores
pragmáticos que condicionan el tratamiento
de los contenidos. La mayor parte de los
sistemas están diseñados como procesadores
descontextualizados, insensibles a si el texto
forma parte de una referencia bibliográfica,

el nombre de una persona, una instrucción
de programa, o una cita textual. En algunos
casos, se preve la posibilidad de marcar
parte del texto como no traducible y la
mayoría toman en consideración el contenido
temático, con el que se origina un cambio en
la selección del diccionario de especialidad;
pero poco más.

En marcado contraste con esta práctica,
desde hace unos años existe la tendencia a

utilizar la noción de metadato para agilizar
el procesamiento de información en multitud
de tareas (Kashyap y Sheth, 1998). Con la
generalización de Internet y los problemas
derivados de la publicación de contenidos
multiling¨ues, la noción de metadato asociada
a la gestión de contenidos ha adquirido
especial relevancia (Weibel, 1995; Decker et
al., 2000). En esta comunicación se presenta
un modelo de gestión de
traducciones
que tiene como principal característica la
utilización de metadatos en todas las etapas
del ciclo de vida documental. El aspecto
más destacable es
la estructuración de
contenidos y las funciones de consulta y
recuperación de documentos en un sistema
de publicación en web (Zope Comunity, 2003)
en el que se ha incorporado una estructura de
metadatos basada en la propuesta TEI (TEI
Consortium, 2003).

Por otra parte,

la idea de que

la
traducción no es un eslabón aislado en la
cadena documental, sino que forma parte
de un amplio proceso, ha sido uno de los
pilares de la recién desarrollada tecnología
de localización. La localización se ocupa,
en general, de la traducción y adaptación
de contenidos en soporte electrónico y, en
particular, de la creación y mantenimiento
de webs multiling¨ues (Localization Industry
Standards Association, 2003; Esselink, 2000).
Entre las fases que suelen contemplarse están
la revisión de los textos,
las pruebas de
validación de productos, las actualizaciones,
así como las
tareas de coordinación y
dirección de proyectos. El estándar XLIFF
es una propuesta reciente que tiene como
objetivo permitir que todos los materiales
utilizados en la elaboración de un producto
que va a ser multiling¨ue puedan transportarse
sin problemas de una fase a otra, a través de
herramientas y plataformas distintas, sin que
se produzca ninguna pérdida de información
(Savourel, 2001). Por este motivo, XLIFF
representa un excelente complemento a la
gestión de contenidos basada en TEI.

En la sección 2 se expone la estrategia
de catalogación del corpus de traducciones,
cuyo esquema de descripción de contenidos
está basado en la propuesta de cabecera
de TEI. A continuación se introducen los
aspectos más relevantes de la arquitectura
del gestor, que debe la mayor parte de los
rasgos de operatividad a las particularidades
de diseño de Zope. En la sección 4 se

muestran las
funciones de actualización,
filtrado y búsqueda de contenidos en la base
documental, que está concebida como una
base de datos orientada a objetos. De esta
forma se comprobará la idoneidad de Zope
como gestor de contenidos multiling¨ues. Un
aspecto que el modelo de metadatos basado
en TEI todavía no resuelve adecuadamente es
el control de versiones; por ello se analiza en
la sección 5 la incorporación al sistema de un
nuevo nivel de descripción basado en XLIFF.

2. Los metadatos de TEI

El estándar para la anotación estructural
de textos TEI posee como principal virtud
un diseño de cabecera <teiHeader> con
una gran capacidad para recoger información
con valor documental,
lo que le asemeja
a los sistemas de catalogación de objetos
bibliográficos (Caplan, 2001; Wittenburg y
Broeder, 2002). Una cabecera TEI tiene
cuatro partes:

1. la descripción del archivo <fileDesc>,
descripción
que permita

una
completa

contiene

que
bibliográfica
su citación;

2. una descripción sobre la codificación
<encodingDesc>, en la que se precisan
las incidencias en el momento de la
transcripción;

3. perfil del

texto <profileDesc> que
resuelve aspectos contextuales (fecha de
creación, categorización, etc.);

4. historial de revisiones <revisionDesc>
que permite llevar un registro de los
cambios
la versión
electrónica.

realizados

sobre

Por este motivo se puede decir que
TEI aporta una metalenguaje sumamente
adecuado para describir documentalmente un
corpus textual. La cabecera de un documento
en formato TEI se muestra en la figura 1.

Hay que señalar que la información
ofrecida en la cabecera <teiHeader> se
complementa con la aportada en la sección
<front> del propio texto, en la que se
recogen datos
contenidos
en el documento, normalmente en la parte
superior de la versión impresa. En este
caso, los nuevos datos recogidos son la fecha
original del documento <docDate>, el nombre
de la persona que lo firma <docAuthor>

explícitamente

<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE TEI.2 SYSTEM "teixlite.dtd">
<TEI.2>

<teiHeader>
<fileDesc>

<titleStmt>

<title>Reunión de Departamento</title>
<author>Director de Departamento de Filología Inglesa</author>
<funder>Proyecto PI1999-72, Gobierno Vasco</funder>
<principal>Proyecto XML-Bi; grupo DELi</principal>

</titleStmt>
<publicationStmt>

<publisher>Universidad de Deusto</publisher>
<availability><p>Uso interno. Universidad de Deusto</p></availability>

</publicationStmt>
<notesStmt>

<note type="validated" resp="REDACTOR">No</note>

</notesStmt>
</fileDesc>

<encodingDesc>

<projectDesc>XML-Bi</projectDesc>
<classDecl>

<taxonomy id="DELi_SareBi_Tipologia_4">

<bibl>http://www.deli.deusto.es/AboutUs/Projects/XML-Bi/Admin/XML-Bi_I2_an1_tipologia4.txt</bibl>

</taxonomy>
</classDecl>

</encodingDesc>
<profileDesc>

<creation><date>2003/04/14 16:40:49.366 GMT+2</date></creation>
<langUsage>

<language id="es">español</language>

</langUsage>
<textClass>

<classCode scheme="DELi_Tipologia_4">21504</classCode>

</textClass>

</profileDesc>

</teiHeader>
<text>

<front>

<docDate>1999/06/23</docDate>
<docAuthor>Director de Departamento de Filología Inglesa</docAuthor>
<head type="place">Bilbao</head>
<head type="DepSup">1400</head>
<head type="DepInf">1406</head>

</front>
<body> ... </body>

</text>
</TEI.2>

Figura 1: Fichero en formato TEI.

(que en nuestro corpus es
reemplazado
por el cargo del firmante) que por defecto
coincide con el <titleStmt:author>), el
lugar en el que se firma y la filiación.
Los códigos 1400 y 1406 de los atributos
DepSup y DepInf identifican respectivamente
a la Facultad de Filosofía y Letras y al
Departamento de Filología Inglesa. En la
actualidad existen 93 códigos de centros
(facultades,
departamentos,
órganos de gobierno, servicios, etc.).

institutos,

criterios de

Un aspecto destacable de la cabecera es
la taxonomía de categorías documentales.
En la versión actual, que es la cuarta, se han
contemplado tres niveles de categorización
atendiendo
función
comunicativa, género y tema. Estos criterios
están basados en la propuesta de clasificación
tipológica de (Trosborg, 1997). En esta
versión existen 282 categorías, divididas
de manera jerárquica entre tres funciones
comunicativas
e
inquirir), 25 géneros y 256 temas. La

(reglamentar,

a

los

informar

tipología fue uno de los desarrollos del
proyecto XML-Bi (Abaitua et al., 2001)
y en su elaboración desempeñaron un
destacado papel el equipo de traductoras
de la Universidad. Un ejemplo del género
instancia
  • Links de descarga
http://lwp-l.com/pdf3179

Comentarios de: Gestión de traducciones mediante metadatos TEI y XLIFF (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad