PDF de programación - Un paso adelante - Plan de tecnologías lingüísticas libres

Imágen de pdf Un paso adelante - Plan de tecnologías lingüísticas libres

Un paso adelante - Plan de tecnologías lingüísticas libresgráfica de visualizaciones

Actualizado el 22 de Julio del 2017 (Publicado el 6 de Marzo del 2017)
630 visualizaciones desde el 6 de Marzo del 2017
50,3 KB
15 paginas
Creado hace 20a (09/09/2003)
Un paso adelante

Table of Contents

Un paso adelante.................................................................................................................................................1
Plan de tecnologías lingüísticas libres.....................................................................................................1
Juan Rafael Fernández García....................................................................................................1
1. Introducción.........................................................................................................................................2
1.1. ¿Por qué?..............................................................................................................................3
2. Al grano...............................................................................................................................................4
2.1. Propuesta: Líneas generales.................................................................................................4
2.2. Diccionarios.........................................................................................................................5
2.3. Correctores ortográficos....................................................................................................10
2.4. Correctores ortotipográficos..............................................................................................10
2.5. Terminologías y herramientas de gestión terminológica (TMS).......................................10
2.6. Correctores gramaticales y de estilo..................................................................................12
2.7. Corpora monolingües.........................................................................................................12
2.8. Corpora paralelos y multilingües.......................................................................................12
2.9. Memorias de traducción.....................................................................................................13
Notas.........................................................................................................................................13

Un paso adelante

Plan de tecnologías lingüísticas libres

Juan Rafael Fernández García

Coordinador responsable de herramientas lingüísticas TLDP−ES

Copyright © 2003 por Juan Rafael Fernández García

$Id: un−paso−adelante.xml,v 1.3 2003/09/08 21:42:57 juanfernandez Exp $

2003−03−17

2003−02−26

2003−02−25

Historial de revisiones
Revisión 0.7
Versión enviada al VI Congreso Hispalinux
Revisión 0.6
Superada tortura de xmllint, victorioso
Revisión 0.5
La información pasa a doc−traduccion−libre
Revisión 0.4
Modificaciones menores del marcado
Revisión 0.3
Revisión del xml
Revisión 0.2
Primera versión xml
Revisión 0.1
Versión inicial (txt)

2003−09−07

2003−02−24

2003−02−20

2002−17−12

Revisado por: jrf

Revisado por: jrf

Revisado por: jrf

Revisado por: jrf

Revisado por: jrf

Revisado por: io

Revisado por: jrf

Notas previas para una especificación de requisitos de las herramientas lingüísticas de TLDP (La
comprensión plena de este documento requiere familiaridad con las herramientas lingüísticas o la lectura
previa de doc−traducción−libre http://es.tldp.org/Articulos/0000otras/doc−traduccion−libre/ , documento
producido en el seno de TLDP−ES)

En este artículo el autor presenta y justifica sus propuestas con respecto a la adopción de estándares libres de
marcado e intercambio de información lingüística y el desarrollo de herramientas libres de ayuda a la escritura
y traducción, de manera que puedan someterse a discusión pública y adoptarse como especificaciones de
TLDP. Es en cierto modo un apéndice ejecutivo, las conclusiones de la exposición realizada en el documento
anterior.





Última versión:
http://es.tldp.org/especificaciones/herramientas−linguisticas/herramientas−linguisticas/

Fuente: http://cvs.hispalinux.es/cgi−bin/cvsweb/esp−herramientas−linguisticas/un−paso−adelante.xml

Tabla de contenidos
1. Introducción

1.1. ¿Por qué?

1.1.1. La crisis: más allá de los ficheros .po

2. Al grano

2.1. Propuesta: Líneas generales
2.2. Diccionarios

2.2.1. Discusión
2.2.2. Propuesta
2.2.3. Un caso práctico

2.3. Correctores ortográficos
2.4. Correctores ortotipográficos
2.5. Terminologías y herramientas de gestión terminológica (TMS)

2.5.1. ¿Terminología o Memorias de traducción?
2.5.2. Propuesta

2.6. Correctores gramaticales y de estilo
2.7. Corpora monolingües

2.7.1. Discusión
2.7.2. Propuesta

2.8. Corpora paralelos y multilingües

2.8.1. Discusión
2.8.2. Propuesta

2.9. Memorias de traducción

2.9.1. Discusión
2.9.2. Propuesta

1. Introducción

La temática de este documento es lo que en la jerga de la industria se llama localization (no me atrevo yo a
traducir «localización»), directamente relacionada con la traducción y sus herramientas. Me he esforzado en
atenerme a desarrollos posibles a corto y medio plazo, pero continuamente me ha asaltado la tentación de
entrar en el tema de la traducción automática. Queremos, a corto plazo, que las máquinas nos ayuden a
traducir; a medio plazo el objetivo es que traduzcan por nosotros. Lo que pasa es que los dos objetivos
convergen en dotar de inteligencia a las máquinas. Pienso que cualquier asistente a la traducción necesita
reglas: morfológicas, sintácticas, semánticas, necesita una gramática y un «conocimiento del mundo». ¿Cómo
traduciría un programa sin inteligencia oraciones como spirits sold here? ¿cómo puede un humilde corrector
ortográfico distinguir a de ha?

Es la hora de que el software libre llegue a la madurez. Eso implica también que conozcamos las tendencias
de la industria y adoptemos y trabajemos con los estándares. Este documento trata de señalar el camino para el
desarrollo de nuestras herramientas de CAT, con el ojo puesto en el desarrollo futuro de herramientas de
traducción más o menos automática. Ahora hay que ponerse técnicos y me temo que la lectura no va a ser
fácil; no soy un experto y escribo mientras aprendo así que es probable que se encuentren inexactitudes que
será conveniente corregir. De todos modos no pretendo más de plantear unas perspectivas y unas posibles
líneas de desarrollo; está claro que LuCAS y TLDP son ejemplos de éxito como modelos de cooperación libre
y que el actual proceso de creación de la editorial libre y la conversión de la documentación a DocBook XML
son grandes ideas.

Dice Ismael Olea, hablando del desarrollo de TLDP,

Hay dos niveles de objetivos a cumplir:

herramientas para el fácil mantenimiento y traducción de nuestra documentación

¤

¤

herramientas lingüísticas de calidad

Empezar a trabajar en la segunda opción no debe suponer merma de la primera.

1.1. ¿Por qué?

Pensando sobre el esquema de Ismael Olea Arquitectura para reproducción y publicación del borrador de
LuCAS v4: creando el sistema de publicación de TLDP−ES (
http://cvs.hispalinux.es/cgi−bin/cvsweb/doc−conf−creando−lucasv4/herramientas−reproduccion−publicacion.png
), creo que es el momento intentaré explicar por qué de integrar en el esquema las herramientas lingüísticas y
dar el paso de adoptar los estándares y potencialidades de la ingeniería lingüística actual.

Dependiendo de cómo nos planteemos la realidad de nuestro fondo documental, podemos pensar en él como
en una gran biblioteca electrónica, como un repositorio digital (como el DSpace del MIT) o como un gran
corpus lingüístico. Cada punto de vista plantea posibilidades distintas: en tanto que biblioteca, debemos
escuchar las aportaciones de los bibliotecónomos. Debemos también acordar los metadata y el formato de
registro de los documentos, para que las búsquedas sean cada vez más eficaces. Yo, como lingüista, propongo
que lo miremos con un nuevo enfoque: somos un gran equipo de traductores y redactores de documentación.
Una de nuestras prioridades debe ser mejorar nuestras herramientas de ayuda a la escritura.

Disponemos de un fondo de varios cientos de megas de documentación técnica, en proceso de transcripción a
DocBook XML, en su mayor parte traducciones de obras o documentación de tema informático que también
son de licencia libre y disponemos además de las traducciones a multitud de idiomas. Ninguna empresa
¿quizás alguna universidad? dispone de un fondo documental como el nuestro para la elaboración de
terminologías específicas, para la confección de un corpus tan completo de la materia ni para la creación de
memorias de traducción. Ninguna empresa dispone del número de traductores de que dispone la comunidad
GNU Linux. Y sin embargo las características de esta comunidad (en su mayor parte estudiantes y
profesionales de la informática) hace que el modo de trabajar y las herramientas estén a años luz de las
posibilidades que presenta la investigación actual. No se conocen las experiencias que se realizan en la Unión
Europea ni las herramientas que se utilizan, ignoramos los proyectos universitarios y los intentos de
estandarización que está realizando la industria.

Y la distancia con respecto a la evolución del software propietario, lamentablemente, se amplía en lugar de
acortarse. La comunidad, bajo el nombre de HispaLinux, o de TLDP o de FSF o del que sea, debe funcionar
como una entidad y personarse y participar en los foros donde se están creando estándares (LISA, ISLE) y en
los proyectos financiados por la Unión Europea (debemos aspirar a recibir financiación de las instituciones y
de las empresas). Es la hora de preguntarse si el modelo de voluntarios a tiempo parcial es eficaz para los
objetivos que nos proponemos.

1.1.1. La crisis: más allá de los ficheros .po

No podemos olvidar que gettext y .po resuelven algunos de los problemas con los que tiene que enfrentarse
todo software de traducción: la extracción de las cadenas que deben ser traducidas, la segmentación y la
referencia al lugar en el código al que pertenece la cadena, la alineación entre texto fuente y text
  • Links de descarga
http://lwp-l.com/pdf2526

Comentarios de: Un paso adelante - Plan de tecnologías lingüísticas libres (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad