El llenguatge de les màquines

attention open in a new windowPDFPrintE-mail

Written by Edgar Gonzálezdivendres, 15 setembre 2006 16:27

El lenguaje de las máquinas

Els cercadors han estat una eina clau en l’explosió d’Internet. L’accés a l’enorme quantitat d’informació que conté la xarxa seria impossible sense l’ajuda d’aquests sistemes que a partir d’unes paraules clau ens localitzen les pàgines on podem trobar els conceptes que ens interessen. Tot i això, per utilitzar els cercadors els humans ens hem d’adaptar a la manera de pensar de les màquines. No seria possible que les màquines ens entenguessin a nosaltres, els humans, en el nostre idioma? Aquest és l’objectiu dels investigadors que treballen en el que s’anomena “processament del llenguatge natural”.

La traducción automática ruso-inglés se consideró fundamental durante la Guerra Fría. Dibujo de Oriol Massana

El principi de tot plegat

Aconseguir que les màquines entenguessin les llengües de les persones va ser un dels primers objectius dels científics que van començar a desenvolupar ordinadors. La traducció automàtica rus-anglès es va considerar fonamental durant la Guerra Freda, i el primer sistema va construir-se l’any 1954. Tanmateix, 10 anys després la recerca va quedar encallada: es van tallar les subvencions i la investigació en aquest camp va ser abandonada.  

L’interès pel processament del llenguatge natural va renéixer anys després, quan es començà a investigar en tasques més bàsiques per a la comprensió de textos. A mida que els components de base van anar fent-se disponibles, es van poder atacar problemes reals més grans. Avui dia existeix un gran nombre de programes que realitzen processament del llenguatge natural: traductors, resumidors, cercadors de resposta... Encara que la tecnologia és força jove, es poden obtenir bons resultats si es restringeix el tema dels documents.

Traducció automàtica

Existeixen molts sistemes de traducció automàtica funcionant en entorns administratius i empresarials. Així, la Comissió Europea utilitza SYSTRAN des de l’any 1976 per traduir documents oficials entre 18 parelles d’idiomes. D’altra banda, tenim un exemple més actual: l’edició bilingüe de El Periódico utilitza un sistema automàtic de traducció entre castellà i català.

Traducción de una página del diario SPORT (http://www.sport.es/) al vasco realizada mediante OPENTRAD (http://www.opentrad.com/) A Internet, el traductor més popular és BabelFish, que tradueix entre l’anglès i altres llengües. Google també ofereix un servei potent de traducció. Més recentment, ha aparegut el sistema OpenTrad (veure imatge inferior) per a realitzar traduccions entre les llengües oficials d’Espanya. Abans, però, la Universitat d’Alacant ja havia posat en marxa Internostrum, una eina molt útil per traduir textos de català (valencià) a castellà i viceversa. Tots aquests sistemes són força efectius; tanmateix, un cop realitzada la traducció sempre és necessària una revisió posterior.

Resum automàtic

El resum automàtic té com a objectiu donar una versió abreujada d’un o diversos documents que parlen d’un cert tema. Potser l’exemple més proper és la funció d’autoresum del Microsoft Word.

 Word.

Página principal de SWESUM, un sistema para resumir páginas web de noticias Un sistema disponible online per a resumir més d’un document (en anglès) és MEAD, desenvolupat per un grup d’investigadors d’arreu del món. Per la seva banda, SWESUM (veure imatge de l’esquerra) es un sistema per a resumir pàgines web de notícies.

Cerca de resposta

Els sistemes de cerca de resposta intenten trobar una resposta concreta a una pregunta concreta. Així, si volem saber quina és l’alçada de la Torre Eiffel, en comptes de cercar “Torre Eiffel” en un buscador i tractar de trobar aquesta informació entre els documents que apareixen, podem usar un sistema de cerca de resposta i preguntar-li “Quina és l’alçada de la Torre Eiffel?”

Página de BRAINBOST tras preguntarle dónde nació Thomas A. Edison Hi ha diversos sistemes de cerca de resposta que es poden provar online com el de l’empresa americana Language Computer, Answerbus (un projecte de la Universitat de Saarbrücken), Brainboost (imatge dreta) i per últim, el sistema START, fet pel famós MIT (Massachusetts Institute of Technology) de Boston. Tots aquests sistemes només funcionen en anglès.