Saltar al contenido (pulsar Return)

Tres estudiantes de doctorado de la UPC-ESEIAAT premiados por la RAE por un algoritmo que identifica neologismos tecnológicos

Tres estudiantes de doctorado de la UPC-ESEIAAT premiados por la RAE por un algoritmo que identifica neologismos tecnológicos

Tres estudiantes de doctorado de la Escuela Superior de Ingeniería Industrial, Aeroespacial y Audiovisual de Terrassa (ESEIAAT) de la Universidad Politécnica de Cataluña · BarcelonaTech (UPC) han resultado ganadores del segundo premio dotado con 1500 € en la hackathon "Neologismos y tecnicismos en el ámbito energético y medioambiental "organizado por la RAE y la fundación ENDESA. Pol Fontanes, del grupo de investigación Lightning Research Group (LRG); Víctor Martínez y Eva María Urbano, ambos del grupo Motion Control and Industrial Applications (MCIA), han sido galardonados por su proyecto ADAN (Algoritmo de Detección Automática de neologismos).

 

El pasado mes de mayo la Real Academia de la Lengua Española y la Fundación Endesa organizaron la hakaton "Neologismos y tecnicismos en el ámbito energético y medioambiental", en la que participaron vía telemática más de 400 personas. El reto, que forma parte del proyecto LEIA de la RAE (Lengua Española e Inteligencia Artificial) consistía en proponer en un tiempo de 24 horas ideas y proyectos de inteligencia artificial para el estudio de neologismos y tecnicismos en el sector energético y medioambiental.

Los trabajos de los participantes tenían que resolver cuestiones como "¿Cuáles son las palabras de uso más reciente en el sector?", "¿Qué tecnicismos se utilizan?", "¿Qué han pasado ya al uso más general?", " cuáles extranjerismos son los más frecuentes? " "Existen alternativas en español a estos extranjerismos?" La propuesta de los estudiantes de doctorado

Pol Fontanes, Víctor Martínez y Eva María Urbano, del ESEIAAT) han sido los ganadores del segundo premio de la hackaton gracias a su  Algoritmo de Detección Automática de neologismos (ADAN). ADAN se basa en la utilización de algoritmos de inteligencia artificial y big data para procesar textos y así identificar las palabras sospechosas de ser neologismos.

Para conseguirlo, ADAN hace uso de técnicas llamadas de Natural Language Processing (NLP) con las que es capaz de analizar morfológica, sintáctica y semánticamente los textos en busca de los neologismos y extranjerismos, cuyos significados son inferidos por el contexto en caso ser desconocidos. ADAN trabaja sobre un corpus de las más recientes publicaciones científicas en español en el ámbito de la energía y el medioambiente, así como los artículos divulgativos y de la prensa especializada del sector. De esta manera el sistema capta la aparición de estos nuevos términos tan pronto como éstos entren en uso, realizando también la trazabilidad de la frecuencia de sus apariciones.

Tal y como explica Eva María Urbano, "los algoritmos que hemos utilizado se apoyan en consultas a bases de conocimiento y herramientas de traducción, que deducen si las palabras identificadas en primera instancia como neologismos son ya ampliamente aceptadas como una palabra del idioma español o, por el contrario, se trata de anglicismos o tecnicismos, de los que se han de proponer alternativas en español o bien analizar su significado según el contexto."

Urbano añade que "antes de empezar a trabajar, la RAE nos hizo ver la importancia de generar estrategias inteligentes para asegurar un entendimiento correcto entre el sector digital y nuestra parte humana; así podremos avanzar hacia la integración de la tecnología sin dejar de lado la riqueza del lenguaje ".

El jurado de la Hackaton "Neologismos y tecnicismos en el ámbito energético y medioambiental" ha valorado el grado de finalización, su originalidad, exhaustividad, automaticidad, dificultad técnica, viabilidad, diseño y la usabilidad de las herramientas del proyecto ADAN

En palabras de Santiago Muñoz Machado, director de la RAE,  "Los neologismos son un asunto importante, porque invaden con mucha velocidad el terreno de las ciencias y las nuevas tecnologías [...] Cada día las maquinas hablan más y hay un número mayor de máquinas que hablan y usan un idioma que no es necesariamente lo que ha normativizado la RAE, sino que es el idioma que han determinado sus fabricantes."


FOTO: De izquierda a derecha , Pol Fontanes, Eva Maria Urbano i Víctor Martínez con sendos diccionarios de la RAE

info.png

Más información