El llenguatge de les màquines
Written by Edgar Gonzálezdivendres, 15 setembre 2006 16:27

El principi de tot plegat
Aconseguir que les màquines entenguessin les llengües de les persones va ser un dels primers objectius dels científics que van començar a desenvolupar ordinadors. La traducció automàtica rus-anglès es va considerar fonamental durant la Guerra Freda, i el primer sistema va construir-se l’any 1954. Tanmateix, 10 anys després la recerca va quedar encallada: es van tallar les subvencions i la investigació en aquest camp va ser abandonada.
L’interès pel processament del llenguatge natural va renéixer anys després, quan es començà a investigar en tasques més bàsiques per a la comprensió de textos. A mida que els components de base van anar fent-se disponibles, es van poder atacar problemes reals més grans. Avui dia existeix un gran nombre de programes que realitzen processament del llenguatge natural: traductors, resumidors, cercadors de resposta... Encara que la tecnologia és força jove, es poden obtenir bons resultats si es restringeix el tema dels documents.
Traducció automàtica
Existeixen molts sistemes de traducció automàtica funcionant en entorns administratius i empresarials. Així, la Comissió Europea utilitza SYSTRAN des de l’any 1976 per traduir documents oficials entre 18 parelles d’idiomes. D’altra banda, tenim un exemple més actual: l’edició bilingüe de El Periódico utilitza un sistema automàtic de traducció entre castellà i català.
A Internet, el traductor més popular és BabelFish, que tradueix entre l’anglès i altres llengües. Google també ofereix un servei potent de traducció. Més recentment, ha aparegut el sistema OpenTrad (veure imatge inferior) per a realitzar traduccions entre les llengües oficials d’Espanya. Abans, però, la Universitat d’Alacant ja havia posat en marxa Internostrum, una eina molt útil per traduir textos de català (valencià) a castellà i viceversa. Tots aquests sistemes són força efectius; tanmateix, un cop realitzada la traducció sempre és necessària una revisió posterior.
Resum automàtic
El resum automàtic té com a objectiu donar una versió abreujada d’un o diversos documents que parlen d’un cert tema. Potser l’exemple més proper és la funció d’autoresum del Microsoft Word.
Word.
Un sistema disponible online per a resumir més d’un document (en anglès) és MEAD, desenvolupat per un grup d’investigadors d’arreu del món. Per la seva banda, SWESUM (veure imatge de l’esquerra) es un sistema per a resumir pàgines web de notícies.
Cerca de resposta
Els sistemes de cerca de resposta intenten trobar una resposta concreta a una pregunta concreta. Així, si volem saber quina és l’alçada de la Torre Eiffel, en comptes de cercar “Torre Eiffel” en un buscador i tractar de trobar aquesta informació entre els documents que apareixen, podem usar un sistema de cerca de resposta i preguntar-li “Quina és l’alçada de la Torre Eiffel?”
Hi ha diversos sistemes de cerca de resposta que es poden provar online com el de l’empresa americana Language Computer, Answerbus (un projecte de la Universitat de Saarbrücken), Brainboost (imatge dreta) i per últim, el sistema START, fet pel famós MIT (Massachusetts Institute of Technology) de Boston. Tots aquests sistemes només funcionen en anglès.
Recursos
Traductors :
- SYSTRAN: http://www.systransoft.com/
- BABELFISH : http://espanol.babelfish.yahoo.com/
- OPENTRAD: http://www.opentrad.org/
- INTERNOSTRUM: http://www.internostrum.com/
Resumidors:
- MEAD: http://tangra.si.umich.edu/clair/md/demo.cgi
- SWESUM: http://swesum.nada.kth.se/
- LIBOTS: http://libots.sourceforge.net/
Cerca de resposta:
- BRAINBOOST: http://www.brainboost.com/
- ANSWERBUS : http://answerbus.coli.uni-saarland.de/index.shtml
- START: http://start.csail.mit.edu/




