Se encuentra usted aquí

Noticia
PLN
| Servicios públicos | Economía digital
Se ha celebrado en Barcelona, en el marco de 4YFN

Un proyecto de turismo y otro que facilita el aprendizaje de los compuestos químicos ganan el II Hackathon de Tecnologías del Lenguaje

II Hackthon de Tecnologías del Lenguaje, finalistas 'Corpus General'
II Hackthon de Tecnologías del Lenguaje, finalistas 'Biomedicina'
II Hackthon de Tecnologías del Lenguaje, equipos trabajando

Este lunes y martes se celebró en el marco del evento ‘4 Years From Now’, en Barcelona, la fase final del II Hackathon de Tecnologías del Lenguaje que organizan Red.es y la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital (SESIAD). La competición ha estado estructurada en dos categorías y los ganadores han sido los proyectos ‘Sistemas Conversacionales Negociativos Multilingües con Lekta’ (‘Corpus General’) y ‘Sistema de extracción automática y visualización 3D de moléculas en textos biomédicos’ (‘Biomedicina’).

El primero de estos prototipos, ‘Sistemas Conversacionales Negociativos Multilingües con Lekta’, ha sido desarrollado por un grupo de trabajo liderado por Francisco Quesada, que tras alzarse como ganador, el pasado lunes, explicaba así su proyecto: “En 2017 vinieron a España 82 millones de turistas que hablan un montón de idiomas distintos. Por otra parte, la política turística de nuestro país promueve la cultura, la gastronomía, los museos... Nuestra aplicación utiliza las tecnologías del lenguaje para facilitar al viajero el acceso a la información sobre eventos, actividades y recursos turísticos relacionados con la cultura. Es un proyecto multilingüe, de momento en inglés y español, y multicanal, ya que funciona a través de voz, con el móvil, y de texto, mediante una web”.

El proyecto ‘Sistema de extracción automática y visualización 3D de moléculas en textos biomédicos’, por su parte, ha sido impulsado por otro grupo de trabajo, encabezado por Enrique Puertas. Ayer, tras recibir el primer premio de la categoría ‘Biomedicina’, explicó así su funcionamiento: “Nuestro proyecto trata de ayudar a los estudiantes del área de salud –Medicina, Farmacia, Biotecnología…– a estudiar los compuestos químicos a partir de textos biomédicos. Para ello, hemos creado un sistema que detecta compuestos químicos en casos clínicos y documentos científicos, ya sea con su formulación o nombre común, y ofrece al estudiante información complementaria sobre ellos. También incorpora la opción de visualizarlos en tres dimensiones, lo que ayuda a entender que esas moléculas son tridimensionales y que eso influye en la forma en la que interactúan”.

Clasificados en segundo y tercer lugar

En categoría ‘Corpus General’, en la que participaron cuatro finalistas, quedó en segundo lugar el prototipo ‘Monitor de dispersión geográfica de enfermedades’, realizado por el grupo de investigación SINAI de la Universidad de Jaén y presentado por Salud María Jiménez Zafra como portavoz del grupo. Esta aplicación opera en Twitter y detecta contenidos localizados en ciudades españolas que permiten predecir brotes epidémicos (gripe, cáncer, asma…), con mucha más rapidez que el sistema convencional. El tercer clasificado fue el proyecto Red.Facil.Es, impulsado por Horacio Saggión, de la Universidad Pompeu Fabra. Su funcionalidad consiste en resumir textos en Internet para hacerlos más comprensivos a las personas con discapacidad intelectual o con insuficiente formación técnica sobre contenidos específicos.

Los proyectos fueron evaluados por un jurado compuesto por: David Pérez (SESIAD), María Fernández Rancaño (Red.es), María Antonia Martí (SEPLN), Agustí Cerrillo (UOC), Agnès Ponsati (BNE), Maite Melero (ELRC), José Luis Fernández-Checa Roy (Agencia EFE) y Juan Gascón (AMETIC).

En la categoría de ‘Biomedicina’ concursaron un total de 10 finalistas. El segundo puesto fue para ‘CodeMyHealth’, desarrollado por Everis. Este sistema es capaz de procesar informes clínicos escritos en lenguaje natural e interpretarlos para realizar una codificación automática en un estándar internacional de terminología. En tercer lugar quedó el proyecto ‘Estructuración de resúmenes de artículos biomédicos para una mejor comprensión del lector’, desarrollado por Álex Bravo. Trabaja sobre un corpus de 2.500 artículos médicos en inglés y español, cuyas frases etiqueta por secciones normalizadas (introducción, métodos, resultados y conclusiones).

Los miembros del jurado que evaluaron la categoría de ‘Biomedicina’ fueron: David Pérez (SESIAD), Juan Ramón González (Red.es), Martin Kralinger (CNIO), Marta Villegas (BSC), Arturo Romero (MSSSI), Monserrat Marimón (UPF), Juan Ignacio Godino (UPM) y Cristina Bojo (ISCIII).

Los primeros clasificados de las dos categorías reciben un premio de 3.000 euros, mientras que los segundos se llevan 2.000 euros y los clasificados en tercer lugar, 1.000. En este enlace se pueden conocer todos los proyectos finalistas.

Plan de Impulso de las Tecnologías del Lenguaje y colaboradores

Esta actividad se enmarca en el Plan de Impulso de las Tecnologías del Lenguaje y tiene como objetivo incentivar el talento, la capacidad técnica y la creatividad de los participantes; difundir las capacidades y las oportunidades de este subsector, y promocionar el trabajo en grupo y la colaboración entre los equipos participantes.

El II Hackathon de Tecnologías del Lenguaje ha contado con la colaboración de la Agencia Efe, el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) y el programa SciELO, a través del Instituto de Salud Carlos III.

La Agencia Efe ha puesto a disposición de los participantes un corpus de noticias de ámbito general que ya ha sido utilizado en otras ocasiones para el desarrollo de infraestructuras lingüísticas y que está organizado por temáticas. SciELO, por su parte, ha incorporado un corpus para la categoría de Biomedicina, con más de 745.000 artículos a disposición de los participantes. El BSC-CNS, asimismo, ha proporcionado acceso a sus infraestructuras de HPC (High Perfomance Computing) y asesoramiento a los participantes en tecnologías del lenguaje.