Tres estudiants de doctorat de la UPC-ESEIAAT premiats per la RAE per un algoritme que identifica neologismes tecnològics
17/06/2021
Tres estudiants de doctorat de l’Escola Superior d’Enginyeria Industrial, Aeroespacial i Audiovisual de Terrassa (ESEIAAT) de la Universitat Politècnica de Catalunya·BarcelonaTech (UPC) han resultat guanyadors del segon premi dotat amb 1500€ a la hackathon “Neologismos y tecnicismos en el ámbito energético y mediambiental” organitzat per la RAE i la fundació ENDESA. Pol Fontanes, del grup de recerca Lightning Research Group (LRG); Víctor Martínez i Eva María Urbano, ambdós del grup Motion Control and Industrial Applications (MCIA), han estat guardonats pel seu projecte ADAN (Algoritmo de Detección Automática de Neologismos).
El passat mes de maig la Real Academia de la Lengua Española y la Fundación Endesa van organizar la hakaton “Neologismos y tecnicismos en el ámbito energético y mediambiental”, a la que van participar via telemàtica més de 400 persones. El repte, que forma part del projecte LEIA de la RAE ( Lengua Española e Inteligencia Artificial) consistia en proposar en un temps de 24 hores idees i projectes d’intel·ligència artificial per a l’estudi de neologismes i tecnicismes en el sector energètic i mediambiental
Els treballs dels participants havien de resoldre qüestions com ara “Quines són les paraules d’ús més recent en el sector?”, “Quins tecnicismes s’utilitzen?”, “Quines han passat ja a l’ús mes general?”, “Quins estrangerismes són els més freqüents?” “Existeixen alternatives en espanyol a aquests estrangerismes?” La proposta dels estudiants de doctorat Pol Fontanes, Víctor Martínez i Eva María Urbano, de l’ESEIAAT) ha estat la guanyadoradel segon premi de la hackaton gràcies al seu Algoritmo de Detección Automática de Neologismos (ADAN).
ADAN
ADAN es basa en la utilització d’algoritmes d’intel·ligència artificial i big data per processar texts i així identificar les paraules sospitoses de ser neologismes. Per aconseguir-ho, ADAN fa ús de tècniques anomenades de Natural Language Processing (NLP) amb les que és capaç d’ analitzar morfològica, sintàctica i semànticament els texts en busca dels neologismes i estrangerismes, els significats dels quals son inferits pel context en cas de ser desconeguts.
ADAN treballa sobre un corpus de les més recents publicacions científiques en espanyol en l’ámbit de l’energia i el mediambient, així com els articles divulgatius i de la prensa especialitzada del sector. D’aquesta manera el sistema capta l’aparició d’aquests nous termes tan aviat com aquests entrin en ús tot realitzant també la traçabilitat de la freqüència de les seves aparicions. Tal i com explica Eva Maria Urbano, “els algoritmes que hem utilitzat es recolzen en consultes a bases de coneixement i eines de traducció, que dedueixen si les paraules identificades en primera instància com a neologismes són ja àmpliament acceptades com una paraula de l’idioma espanyol o, ben al contrari, es tracta d’anglicismes o tecnicismes, dels quals s’han de proposar alternatives en espanyol o bé analitzar el seu significat segons el context.”
Urbano afegeix que “abans de començar a treballar, la RAE ens va fer veure la importància de generar estratègies intel·ligents per assegurar un enteniment correcte entre el sector digital i la nostra part humana; així podrem avançar cap la integració de la tecnologia sense deixar de banda la riquesa del llenguatge” conclou Eva.
El jurat de la Hackaton “Neologismos y tecnicismos en el ámbito energético y mediambiental” ha valorat el grau de finalització, la seva originalitat, exhaustivitat, automaticitat, dificultat técnica, viabilitat, disseny i la usabilitat de les eines del projecte ADAN
En paraules de Santiago Muñoz Machado, director de la RAE,: “Els neologismes són un assumpte important, perquè envaeixen amb molta velocitat el terreny de les ciències i les noves tecnologies [...] Cada dia les maquines parlen més i hi ha un nombre major de màquines que parlen i fan servir un idioma que no és necessàriament el que ha normativitzat la RAE, sinó que és l’idioma que han determinat el seus fabricants.”
FOTO: D'esquerra a dreta, Pol Fontanes, Eva Maria Urbano i Víctor Martínez amb sengles diccionaris de la RAE
Comparteix: