[hackmeeting] presentación: recursos multilingües con soft libre

Luistxo Fernandez Luistxo en eibar.org
Vie Sep 7 16:05:26 CEST 2001


El otro día propusimos una charla para el Hackmeeting.

>>
>>Qué:Construyendo recursos multilingües con soft libre.
>>
>>Quién: Luistxo Fernandez (luistxo en eibar.org), Ales Zabala (azabala en codesyntax.com), de Code & Syntax. http://www.codesyntax.com
>>
>>Sobre qué: i18n, localización, multilingüismo, Zope, euskara en Internet...


RAMONE añadió:

>tiene buena pinta, la ponencia se basa en una presentación ya hecha o en info de Inet? Tenéis ponencia escrita? :-m
>En principio parece interesante...
>

La organizaremos en unos pantallazos HTML y los daremos por cañón, quizás viendo ejemplos en vivo de Internet si es posible.

Un adelanto.

--------------------------------
Construyendo recursos multilingües con soft libre.

--------------------------------
Consideraciones previas

Internet es un medio escrito.

La base de los interfaces es el texto, es decir, el lenguaje natural escrito. Por muchos elementos icónicos y multimedia que hallemos en el ordenador, la base sigue siendo el texto. No se puede navegar ni interactuar con las máquinas sin introducir o leer texto.

Incluso cuando llegue el día en que la interacción hombre-máquina sea hablada, el habla será transformada en texto por la máquina para su procesamiento, y viceversa.

Consecuencias

1. Importacia de la ingeniería (procesado) de la lengua dentro de las tecnologías informáticas.

2. Una tienda en Internet es un texto. Y como texto que es, una tienda se puede "traducir"...

3. Lo mismo que el soporte papel, con la imprenta, transformó a las lenguas y las obligó a adaptarse, el soporte interface de las nuevas tecnologías está ya transformando a los idiomas de hoy.

4. Lo mismo que las lenguas ágrafas y sin estándares no se adaptaron a la era del papel, las lenguas sin tecnología...

--------------------------------

¿Debe importarme el tratamiento informático de la lengua si creo websites?

1. Si eres de Kentucky, quizás no.

2. Si tu website es de alguna de estas categorías, probablemente sí:
a) websites que sean versiones en lengua B de un website en lengua A.
b) websites que funcionen simultáneamente en varias lenguas.
c) websites monolingües que se hagan mediante herramientas pensadas para crear webs en inglés.

Si es que sí, en algún momento tu trabajo se verá afectado por cuestiones tales como la i18n, l10n, ingeniería lingüística, gestión de contenidos multilingües, problemas de diseño específico...

--------------------------------

Características del texto (del lenguaje) en los interfaces

1. El lenguaje natural está fragmentado.

Frases a trocitos:
* texto + opciones en un menu + cuadro que debes rellenar + boton con texto para apretar
* Consecuenci a--> si el fragmentado/ordenamiento de esa frase se ha hecho en la lengua A, vete a saber si reproducible en la lengua B, sobre todo si no posibilidad de cambiar el orden o los elementos fragmentables.

Diferente origen de las piezas de texto:
* la fecha la genera un algoritmo, el texto de las imágenes proviene de la carpeta de imágenes, los textos vienen de tal o cual carpeta o de tal sitio remoto, ...o de las preferencias de tu propio ordenador...
* Consecuencia --> Sin un catálogo y control ordenado y práctico de todos esos elementos, difícilmente se pueden mantener versiones multilingües simultáneas o traducir convenientemente una aplicación.

2. Las máquinas manipulan el texto

1. Las máquinas crean texto: fechas, mensajes autómaticos, enumeraciones ("se han encontrado 1 libros")...
Por ejemplo: "Enviat per tfx El Thursday, September 06 @ 23:15:38 CEST (4 llegits)" extraído de un sitio hecho con PHP-nuke en catalán, http://www.cat-linux.com/

2. Las máquinas realizan operaciones con texto.
Indexan y buscan términos. En el caso del euskera, este asunto es particularmente importante y grave, porque es una lengua altamente flexiva...

3. Las máquinas están cada vez más implicadas en el proceso de traducción.
Aunque la traducción automática es una chapuza sin perspectivas decentes, el uso de memoria de traducción SI representa una revolución en las industrias de la lengua.

3. Problemas de diseño en webs traducidos o multilingues

- Mezcla de elementos de distintas lenguas.
- longitudes: texto adecuado a cajas de tamaño X, en las que no cabe una traducción.
- texto metido en imagenes (una decisión siempre arriesgada...)
- separación/organización de elementos de lógica, de diseño, de funcionalidad (mensajes de interface), de contenido...

--------------------------------

Como enfocar este berenjenal.

La experiencia de Code & Syntax con Zope (usando software libre).

...to be continued. (aunque ahí, ya, más que pantallazos de texto, habrá que ver las aplicaciones por dentro, como funcionan las tripas de Zope...)





Más información sobre la lista de distribución HackMeeting