AGUA es el acrónimo de Automatic Grounding Using Annotations que da nombre a mi Proyecto Fin de Máster. No resulta fácil describir de que se trata, por eso, intentaré hacerlo de manera que cualquiera lo pueda entender.
Imaginemos a dos personas que hablan lenguajes completamente distintos, usan palabras distintas para referirse al mismo objeto y además, la manera de componer las frases también es diferente, por ejemplo, uno necesita muchas mas palabras que el otro para tratar de decir lo mismo. Lo más parecido a esto en la vida real es cuando una persona visita un país con un lenguaje y una cultura totalmente distinta a la suya, por ejemplo, un español en Japón. Ante esta situación la comunicación entre ambas personas es prácticamente imposible, existen varias posibilidades para salir del entuerto.
-
Que uno de los dos se aprenda el lenguaje del otro, llevaría demasiado tiempo aprenderse el lenguaje entero para irse de vacaciones. ¿Quién se aprende japonés para irse de luna de miel?
- Utilizar una intérprete que sepa ambos idiomas, llevarse un interprete de vacaciones contigo es algo caro, además, si nos gusta viajar mucho tendría que saber todos los idiomas de los países a los que vaya, un dineral en estudios.
- Por último, la solución más adoptada en estos casos, que ambas personas se comuniquen mediante un lenguaje común, por ejemplo, el Inglés. Cada uno aprende inglés por su cuenta y cuando se quieren comunicar traducen las frases de su lengua a inglés.
¿Y con esto se resuelve el problema? ¿Solamente es necesario que una persona se aprenda inglés y ya puede ir a cualquier parte del mundo? La solución no es tan simple, los problemas aparecen a la hora de tener que aprender el idioma. Realizar la traducción de nuestra lengua a un lenguaje común puede resultar una tarea muy compleja. Además, hay que tener en cuenta que pueden existir distintas variantes de un idioma, y que estos con el tiempo cambian, no es lo mismo el español de España que el de Argentina, el castellano que se habla hoy en día que el castellano que hablaban los Reyes Católicos. Es decir, hay que tener en cuenta que los lenguajes son susceptibles a sufrir cambios.
Sabemos que la solución es hablar un lenguaje común, pero también sabemos que hay que saberlo perfectamente y que este puede variar con el tiempo lo que implica estar continuamente estudiándolo y reaprendiéndolo ¿existe la posibilidad de hablarlo si tener que aprenderlo?
La única manera de poder hacerlo es utilizando algún medio de traducción automático. Traducir palabra a palabra no es una solución válida en casi ningún caso, crear un gran diccionario que, además de palabras, contenga frases hechas, podría servir para entenderse a medias, pero no sería suficiente si lo que necesitamos son traducciones exactas. Almacenar todas las frases de un lenguaje y su correspondiente traducción es inviable.
La solución pasa por la manera en que se construyen las de cada lenguaje, a grandes rasgos, la gramática de un lenguaje es la que define como se construyen las oraciones. Llegados a este punto, imaginemos que somos capaces de hacer una equivalencia entre las gramáticas de dos lenguajes y que además disponemos de todas las palabras traducidas en ambos lenguajes. Con toda esta información, seriamos capaces de coger las reglas gramaticales del español utilizadas para construir la frase la casa de pedro, buscar las reglas gramaticales equivalentes en el inglés, aplicarlas y obtener en un perfecto ingles Peters house. De esta forma podríamos hacer un traductor automático para cualquier lenguaje, lo único que habría que hacer sería establecer las equivalencias entre la gramática de ambos lenguajes.
Tras esta introducción, hablemos de mi trabajo fin de master, que pinto yo en todo esto.
La llegada de Internet supuso una revolución, no solamente por la llegada de las páginas Web. Los ordenadores son capaces de comunicarse entre sí, sin la necesidad de la intervención de una persona. Por ejemplo, cuando compramos un billete de avión nuestro ordenador se comunica con el de la compañía para darle la información que nosotros introducimos en la página Web, el ordenador de la compañía hace la reserva y a continuación le contesta al nuestro con los resultados, nuestro ordenador los coge y nos los muestra por la pantalla. Todo esto funciona porque tanto nuestro ordenador como el de la compañía hablan el mismo idioma y se entienden a la perfección. El lenguaje que hablan ambos se ha tenido que establecer anteriormente cuando se crearon tanto la página Web como el programa que hace las reservas en el ordenador de la compañía. Por ejemplo, lo primero que te voy a mandar es el nombre, lo segundo el apellido, etc. En la mayoría de los casos las personas que hacen ambas partes trabajan en la misma empresa o incluso son la misma persona, con lo cual no es muy complicado que se pongan de acuerdo para establecer el lenguaje.
El problema surge cuando distintas páginas Web, realizadas por distintas compañías o personas, quieren comunicarse con el mismo ordenador. Necesitan forzosamente hablar exactamente el mismo idioma que el. Por otro lado, que pasa si una página Web desea comunicarse con varios ordenadores, por ejemplo, si queremos un billete de avión en una compañía y, si no hay, quiero comprar en otra. Normalmente lo que tienes que hacer es irte a la página Web de la otra compañía, pues la misma página Web no habla ambos idiomas. Es decir estamos en la misma situación planteada al principio, los ordenadores quieren entenderse, necesitan hablar el mismo lenguaje.
Normalmente lo que se hace es que las páginas Web se adapten a los lenguajes de los ordenadores que ofrecen los servicios. Si este cambia el lenguaje las páginas Web se actualizan para afrontar los cambios. Si se necesita comunicarse con varios ordenadores, se hace una página para cada ordenador. Al igual que antes si hay cambios se actualizan aquellas que se ven afectadas. En el caso de que desde una sola página Web quiera comunicarse con un número importante de ordenadores, lo que se hace es poner un ordenador intermediario que hace las veces de traductor. La página Web habla un único lenguaje con el intermediario y este dependiendo de con quien quiera comunicarse realiza la traducción. Si el lenguaje de uno de los ordenadores cambia o se añaden nuevos ordenadores, solamente es necesario modificar el intermediario. En cualquier caso esta traducción se hace mediante un programa realizado por un programador. En los tiempos que corren es cada vez más difícil y costoso mantener estos ordenadores traductores, conocidos también como pasarelas, pues la tecnología avanza y cambia muy rápidamente y los lenguajes que hablan los ordenadores cada vez son más complejos lo que dificulta enormemente su traducción o adaptación.