|
Els cercadors han estat una eina clau en l’explosió d’Internet. L’accés a l’enorme quantitat d’informació que conté la xarxa seria impossible sense l’ajuda d’aquests sistemes que a partir d’unes paraules clau ens localitzen les pàgines on podem trobar els conceptes que ens interessen. Tot i això, per utilitzar els cercadors els humans ens hem d’adaptar a la manera de pensar de les màquines. No seria possible que les màquines ens entenguessin a nosaltres, els humans, en el nostre idioma? Aquest és l’objectiu dels investigadors que treballen en el que s’anomena “processament del llenguatge natural”.
El principi de tot plegat
| Aconseguir que les màquines entenguessin les llengües de les persones va ser un dels primers objectius dels científics que van començar a desenvolupar ordinadors. La traducció automàtica rus-anglès es va considerar fonamental durant la Guerra Freda, i el primer sistema va construir-se l’any 1954. Tanmateix, 10 anys després la recerca va quedar encallada: es van tallar les subvencions i la investigació en aquest camp va ser abandonada. |
Oriol Massana
|
| L’interès pel processament del llenguatge natural va renéixer anys després, quan es començà a investigar en tasques més bàsiques per a la comprensió de textos. A mida que els components de base van anar fent-se disponibles, es van poder atacar problemes reals més grans. Avui dia existeix un gran nombre de programes que realitzen processament del llenguatge natural: traductors, resumidors, cercadors de resposta... Encara que la tecnologia és força jove, es poden obtenir bons resultats si es restringeix el tema dels documents. |
Traducció automàtica
Existeixen molts sistemes de traducció automàtica funcionant en entorns administratius i empresarials. Així, la Comissió Europea utilitza SYSTRAN des de l’any 1976 per traduir documents oficials entre 18 parelles d’idiomes. D’altra banda, tenim un exemple més actual: l’edició bilingüe de El Periódico utilitza un sistema automàtic de traducció entre castellà i català.
|
Traducció d'una pàgina del diari SPORT (http://www.sport.es/) al basc realitzada mitjançant OPENTRAD (http://www.opentrad.com/)
|
A Internet, el traductor més popular és BabelFish, que tradueix entre l’anglès i altres llengües. Google també ofereix un servei potent de traducció. Més recentment, ha aparegut el sistema OpenTrad (veure imatge inferior) per a realitzar traduccions entre les llengües oficials d’Espanya. Abans, però, la Universitat d’Alacant ja havia posat en marxa Internostrum, una eina molt útil per traduir textos de català (valencià) a castellà i viceversa. Tots aquests sistemes són força efectius; tanmateix, un cop realitzada la traducció sempre és necessària una revisió posterior.
|
Resum automàtic
El resum automàtic té com a objectiu donar una versió abreujada d’un o diversos documents que parlen d’un cert tema. Potser l’exemple més proper és la funció d’autoresum del Microsoft Word.
|
Pàgina principal de SWESUM, un sistema per resumir pàgines web de notícies
|
Un sistema disponible online per a resumir més d’un document (en anglès) és MEAD, desenvolupat per un grup d’investigadors d’arreu del món. Per la seva banda, SWESUM (veure imatge de l’esquerra) es un sistema per a resumir pàgines web de notícies.
|
Cerca de resposta
Els sistemes de cerca de resposta intenten trobar una resposta concreta a una pregunta concreta. Així, si volem saber quina és l’alçada de la Torre Eiffel, en comptes de cercar “Torre Eiffel” en un buscador i tractar de trobar aquesta informació entre els documents que apareixen, podem usar un sistema de cerca de resposta i preguntar-li “Quina és l’alçada de la Torre Eiffel?”
|
Pàgina de BRAINBOST després de preguntar-li on va néixer Thomas A. Edison
|
Hi ha diversos sistemes de cerca de resposta que es poden provar online com el de l’empresa americana Language Computer, Answerbus (un projecte de la Universitat de Saarbrücken), Brainboost (imatge dreta) i per últim, el sistema START, fet pel famós MIT (Massachusetts Institute of Technology) de Boston. Tots aquests sistemes només funcionen en anglès. |
Recursos
Traductors :
Resumidors:
Cerca de resposta:
|
|