Se encuentra usted aquí

Noticia
PLN
| Servicios públicos | Economía digital
Se celebra del 26 al 27 de febrero en Barcelona

Catorce proyectos competirán en la fase final del II Hackathon de Tecnologías del Lenguaje en 4YFN

I Hackathon Tecnologías del Lenguaje, participantes trabajando
I hackathon Tecnologías del Lenguaje, SESIAD y ganadores

Un total de catorce proyectos aspiran la semana que viene a ganar el II Hackathon de Tecnologías del Lenguaje, que se celebra en Barcelona en el marco del evento Four Years From Now (26-28 de febrero), dentro de la agenda del Mobile World Congress.

La novedad de esta segunda edición es el establecimiento de dos categorías: ‘Corpus Generales’ y ‘Biomedicina’. En la fase final de ‘Corpus Generales’, que tendrá lugar el día 26, de 10,30 a 18 horas, competirán estos cuatro proyectos:

· RE.FACIL.ES: Resúmenes en Lectura Fácil para la e-inclusión (particular). Su funcionalidad consiste en resumir textos en Internet para hacerlos más comprensivos a las personas con discapacidad intelectual. Su portavoz será Horacio Saggión.

· Monge: Monitor de dispersión geográfica de enfermedades (Universidad de Jaén). Se trata de un prototipo que opera en Twitter y detecta contenidos localizados en las ciudades españolas que permiten predecir brotes epidémicos (gripe, cáncer, asma…). Su portavoz será Salud María Jiménez Zafra.

· Monitorización de Social Media (Instituto Tecnológico de Aragón). Su objetivo es integrar y monitorizar las redes sociales de un usuario. Mediante un módulo de PLN, la ingesta y el almacenamiento de resultados y una aplicación web. Su portavoz será Rocío Aznar.

· Sistemas Conversacionales Negociativos Multilingües con Lekta (particular). Este prototipo pretende mostrar el desarrollo de una arquitectura completa de diseño e implementación de un sistema conversacional negociativo y multilingüe, utilizando como caso de uso su aplicación en el sector turístico. Su portavoz será Francisco Quesada.

La fase final de la categoría de ‘Biomedicina’, por su parte, tendrá lugar el 27 de febrero, de 10,30 a 19 horas. Los proyectos que competirán son diez:

· Detector automático de la negación en documentos clínicos en español (FISEVI). Trabaja sobre un conjunto de documentos clínicos de un hospital de Sevilla que ha sido previamente anotado con información de las partículas de negación y su ámbito asociado. Su portavoz será Noa Cruz.

· Estructuración de resúmenes de artículos biomédicos para una mejor compresión del lector (particular). Trabaja sobre un corpus de 2.500 artículos médicos en inglés y español, cuyas frases etiqueta por secciones normalizadas (introducción, métodos, resultados y conclusiones). Su portavoz será Álex Bravo.

· Asisterm: asistente para la comprensión de terminología médica (particular). Incluye módulos de indización de corpus paralelo de SciELO, anotación e indización de resúmenes en inglés y español, transferencia de las anotaciones a los abstracts en español y expansión de las definiciones de los términos anotados. Su portavoz será Pablo Accuosto.

· Buscador semántico biomédico (Universidad de Jaén). Es un sistema de IR sobre textos biomédicos que identifica terminología especializada de forma automática y la utiliza en un proceso de meta-búsqueda sobre varias bases documentales, enriqueciendo semánticamente los resultados. Su portavoz será Pilar López Úbeda.

· Búsqueda de evidencia clínica en literatura científica (Vicomtech). Quiere dar una aproximación a la problemática de la búsqueda de evidencias clínicas en literatura científica. Implica un demostrador que permite realizar búsquedas semánticas en un conjunto de documentos científicos. Su portavoz será Montserrat Cuadros.

· Sistema de extracción automática y visualización 3D de moléculas en textos biomédicos (Grupo de investigación). Analiza textos de documentos biomédicos y detecta referencias a compuestos químicos mediante reconocimiento de entidades biomédicas nombradas. Permite visualizar en 3 dimensiones las estructuras moleculares detectadas, así como ver información semántica complementaria de ellas.Su portavoz será Enrique Puertas.

· TaxoMed (particular). Esta solución de tecnología semántica toma como entrada un término de nuevo cuño y opcionalmente una definición asociada y, mediante un algoritmo basado en representaciones vectoriales de palabras, devuelve una lista ordenada por confianza de sus posibles inserciones (conceptos altamente similares) en una terminología de referencia. Su portavoz será Luis Espinosa.

· CodeMyHealth (Everis Spain SLU). Propone la creación de un sistema capaz de procesar informes clínicos escritos en lenguaje natural e interpretarlos para realizar una codificación automática en un estándar internacional de terminología. Su portavoz será Alberto Algarra.

· BioAb Miner (Grupo de trabajo). Integra diferentes recursos de Procesamiento del Lenguaje Natural y Aprendizaje Automático para identificar abreviaciones y acrónimos en textos biomédicos, junto a las correspondientes formas extendidas que pueden ocurrir alrededor. Su portavoz será Francesco Ronzano.

· Sistema de Asistencia para el Registro de Información Médica (particular). Sistema conversacional para el registro de información de una visita al dentista, con una app móvil que, a través de la voz, recopila datos del paciente y sus alergias conocidas, registra el estudio y la intervención llevada a cabo, y los medicamentos a aplicar. También asiste en el registro y alerta de posibles incompatibilidades de los tratamientos propuestos con respecto a las alergias indicadas. Su portavoz será Pedro José Galera.

Premios y jurado

Los primeros clasificados de las dos categorías recibirán un premio de 3.000 euros, mientras que los segundos ganarán 2.000 euros y los clasificados en tercer lugar, 1.000.

De evaluar los proyectos se ocupa un jurado compuesto por perfiles provenientes de diferentes áreas de conocimiento e instituciones, con el objetivo de que en cada categoría haya una composición plural.

Las personas que integran el jurado de la categoría ‘Corpus General’ son: David Pérez (SESIAD), María Fernández Rancaño (Red.es), María Antonia Martí (SEPLN), Agustí Cerrillo (UOC), Agnès Ponsati (BNE), Maite Melero (ELRC), José Luis Fernández-Checa (Agencia EFE) y Juan Gascón (AMETIC).

En la categoría de ‘Biomedicina’ los miembros del jurado son: David Pérez (SESIAD), Juan Ramón González (Red.es), Martin Kralinger (CNIO), Marta Villegas (BSC), Arturo Romero (MSSSI), Monserrat Marimón (UPF), Juan Ignacio Godino (UPM) y Cristina Bojo (ISCIII).

Esta actividad se enmarca en el Plan de Impulso de las Tecnologías del Lenguaje y tiene como objetivo incentivar el talento, la capacidad técnica y la creatividad de los participantes; difundir las capacidades y las oportunidades de este subsector, y promocionar el trabajo en grupo y la colaboración entre los equipos participantes.

Colaboradores del II Hackathon

El II Hackathon de Tecnologías del Lenguaje cuenta con la colaboración de la Agencia Efe, el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) y el programa SciELO, a través del Instituto de Salud Carlos III.

Efe pone a disposición de los participantes un corpus de noticias de ámbito general que ya ha sido utilizado en otras ocasiones para el desarrollo de infraestructuras lingüísticas y que está organizado por temáticas. SciELO, por su parte, incorpora un corpus para la categoría de Biomedicina, con más de 745.000 artículos a disposición de los participantes. El BSC-CNS, asimismo, proporciona acceso a sus infraestructuras de HPC (High Perfomance Computing) y asesoramiento a los participantes en tecnologías del lenguaje.

TextDigester, ganadora de la I edición

En la I edición del Hackathon, celebrada hace un año, ganó la aplicación TextDigester, que permite analizar contenidos textuales de páginas HTML como las de un periódico, documentos XML como RSS feed y objetos JSON como los post de Twitter. Una vez detectado el idioma, ejecuta el análisis léxico y semántico de los documentos y, con esta información, implementa varios métodos para generar resúmenes en distintos idiomas.

I hackathon Tecnologías del Lenguaje, SESIAD y ganadores