Noticia
PLN
| Servicios públicos | Economía digital
Se ha celebrado en Barcelona, en el marco de 4YFN

Un proyecto de turismo y otro que facilita el aprendizaje de los compuestos químicos ganan el II Hackathon de Tecnologías del Lenguaje

Este lunes y martes se celebró en el marco del evento ‘4 Years From Now’, en Barcelona, la fase final del II Hackathon de Tecnologías del Lenguaje que organizan Red.es y la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital (SESIAD). La competición ha estado estructurada en dos categorías y los ganadores han sido los proyectos ‘Sistemas Conversacionales Negociativos Multilingües con Lekta’ (‘Corpus General’) y ‘Sistema de extracción automática y visualización 3D de moléculas en textos biomédicos’ (‘Biomedicina’).

El primero de estos prototipos, ‘Sistemas Conversacionales Negociativos Multilingües con Lekta’, ha sido desarrollado por un grupo de trabajo liderado por Francisco Quesada, que tras alzarse como ganador, el pasado lunes, explicaba así su proyecto: “En 2017 vinieron a España 82 millones de turistas que hablan un montón de idiomas distintos. Por otra parte, la política turística de nuestro país promueve la cultura, la gastronomía, los museos... Nuestra aplicación utiliza las tecnologías del lenguaje para facilitar al viajero el acceso a la información sobre eventos, actividades y recursos turísticos relacionados con la cultura. Es un proyecto multilingüe, de momento en inglés y español, y multicanal, ya que funciona a través de voz, con el móvil, y de texto, mediante una web”.

El proyecto ‘Sistema de extracción automática y visualización 3D de moléculas en textos biomédicos’, por su parte, ha sido impulsado por otro grupo de trabajo, encabezado por Enrique Puertas. Ayer, tras recibir el primer premio de la categoría ‘Biomedicina’, explicó así su funcionamiento: “Nuestro proyecto trata de ayudar a los estudiantes del área de salud –Medicina, Farmacia, Biotecnología…– a estudiar los compuestos químicos a partir de textos biomédicos. Para ello, hemos creado un sistema que detecta compuestos químicos en casos clínicos y documentos científicos, ya sea con su formulación o nombre común, y ofrece al estudiante información complementaria sobre ellos. También incorpora la opción de visualizarlos en tres dimensiones, lo que ayuda a entender que esas moléculas son tridimensionales y que eso influye en la forma en la que interactúan”.

Clasificados en segundo y tercer lugar

En categoría ‘Corpus General’, en la que participaron cuatro finalistas, quedó en segundo lugar el prototipo ‘Monitor de dispersión geográfica de enfermedades’, realizado por el grupo de investigación SINAI de la Universidad de Jaén y presentado por Salud María Jiménez Zafra como portavoz del grupo. Esta aplicación opera en Twitter y detecta contenidos localizados en ciudades españolas que permiten predecir brotes epidémicos (gripe, cáncer, asma…), con mucha más rapidez que el sistema convencional. El tercer clasificado fue el proyecto Red.Facil.Es, impulsado por Horacio Saggión, de la Universidad Pompeu Fabra. Su funcionalidad consiste en resumir textos en Internet para hacerlos más comprensivos a las personas con discapacidad intelectual o con insuficiente formación técnica sobre contenidos específicos.

Los proyectos fueron evaluados por un jurado compuesto por: David Pérez (SESIAD), María Fernández Rancaño (Red.es), María Antonia Martí (SEPLN), Agustí Cerrillo (UOC), Agnès Ponsati (BNE), Maite Melero (ELRC), José Luis Fernández-Checa Roy (Agencia EFE) y Juan Gascón (AMETIC).

En la categoría de ‘Biomedicina’ concursaron un total de 10 finalistas. El segundo puesto fue para ‘CodeMyHealth’, desarrollado por Everis. Este sistema es capaz de procesar informes clínicos escritos en lenguaje natural e interpretarlos para realizar una codificación automática en un estándar internacional de terminología. En tercer lugar quedó el proyecto ‘Estructuración de resúmenes de artículos biomédicos para una mejor comprensión del lector’, desarrollado por Álex Bravo. Trabaja sobre un corpus de 2.500 artículos médicos en inglés y español, cuyas frases etiqueta por secciones normalizadas (introducción, métodos, resultados y conclusiones).

Los miembros del jurado que evaluaron la categoría de ‘Biomedicina’ fueron: David Pérez (SESIAD), Juan Ramón González (Red.es), Martin Kralinger (CNIO), Marta Villegas (BSC), Arturo Romero (MSSSI), Monserrat Marimón (UPF), Juan Ignacio Godino (UPM) y Cristina Bojo (ISCIII).

Los primeros clasificados de las dos categorías reciben un premio de 3.000 euros, mientras que los segundos se llevan 2.000 euros y los clasificados en tercer lugar, 1.000. En este enlace se pueden conocer todos los proyectos finalistas.

Plan de Impulso de las Tecnologías del Lenguaje y colaboradores

Esta actividad se enmarca en el Plan de Impulso de las Tecnologías del Lenguaje y tiene como objetivo incentivar el talento, la capacidad técnica y la creatividad de los participantes; difundir las capacidades y las oportunidades de este subsector, y promocionar el trabajo en grupo y la colaboración entre los equipos participantes.

El II Hackathon de Tecnologías del Lenguaje ha contado con la colaboración de la Agencia Efe, el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) y el programa SciELO, a través del Instituto de Salud Carlos III.

La Agencia Efe ha puesto a disposición de los participantes un corpus de noticias de ámbito general que ya ha sido utilizado en otras ocasiones para el desarrollo de infraestructuras lingüísticas y que está organizado por temáticas. SciELO, por su parte, ha incorporado un corpus para la categoría de Biomedicina, con más de 745.000 artículos a disposición de los participantes. El BSC-CNS, asimismo, ha proporcionado acceso a sus infraestructuras de HPC (High Perfomance Computing) y asesoramiento a los participantes en tecnologías del lenguaje.

Noticia
PLN
| Servicios públicos | Economía digital
Se celebra del 26 al 27 de febrero en Barcelona

Catorce proyectos competirán en la fase final del II Hackathon de Tecnologías del Lenguaje en 4YFN

Un total de catorce proyectos aspiran la semana que viene a ganar el II Hackathon de Tecnologías del Lenguaje, que se celebra en Barcelona en el marco del evento Four Years From Now (26-28 de febrero), dentro de la agenda del Mobile World Congress.

La novedad de esta segunda edición es el establecimiento de dos categorías: ‘Corpus Generales’ y ‘Biomedicina’. En la fase final de ‘Corpus Generales’, que tendrá lugar el día 26, de 10,30 a 18 horas, competirán estos cuatro proyectos:

· RE.FACIL.ES: Resúmenes en Lectura Fácil para la e-inclusión (particular). Su funcionalidad consiste en resumir textos en Internet para hacerlos más comprensivos a las personas con discapacidad intelectual. Su portavoz será Horacio Saggión.

· Monge: Monitor de dispersión geográfica de enfermedades (Universidad de Jaén). Se trata de un prototipo que opera en Twitter y detecta contenidos localizados en las ciudades españolas que permiten predecir brotes epidémicos (gripe, cáncer, asma…). Su portavoz será Salud María Jiménez Zafra.

· Monitorización de Social Media (Instituto Tecnológico de Aragón). Su objetivo es integrar y monitorizar las redes sociales de un usuario. Mediante un módulo de PLN, la ingesta y el almacenamiento de resultados y una aplicación web. Su portavoz será Rocío Aznar.

· Sistemas Conversacionales Negociativos Multilingües con Lekta (particular). Este prototipo pretende mostrar el desarrollo de una arquitectura completa de diseño e implementación de un sistema conversacional negociativo y multilingüe, utilizando como caso de uso su aplicación en el sector turístico. Su portavoz será Francisco Quesada.

La fase final de la categoría de ‘Biomedicina’, por su parte, tendrá lugar el 27 de febrero, de 10,30 a 19 horas. Los proyectos que competirán son diez:

· Detector automático de la negación en documentos clínicos en español (FISEVI). Trabaja sobre un conjunto de documentos clínicos de un hospital de Sevilla que ha sido previamente anotado con información de las partículas de negación y su ámbito asociado. Su portavoz será Noa Cruz.

· Estructuración de resúmenes de artículos biomédicos para una mejor compresión del lector (particular). Trabaja sobre un corpus de 2.500 artículos médicos en inglés y español, cuyas frases etiqueta por secciones normalizadas (introducción, métodos, resultados y conclusiones). Su portavoz será Álex Bravo.

· Asisterm: asistente para la comprensión de terminología médica (particular). Incluye módulos de indización de corpus paralelo de SciELO, anotación e indización de resúmenes en inglés y español, transferencia de las anotaciones a los abstracts en español y expansión de las definiciones de los términos anotados. Su portavoz será Pablo Accuosto.

· Buscador semántico biomédico (Universidad de Jaén). Es un sistema de IR sobre textos biomédicos que identifica terminología especializada de forma automática y la utiliza en un proceso de meta-búsqueda sobre varias bases documentales, enriqueciendo semánticamente los resultados. Su portavoz será Pilar López Úbeda.

· Búsqueda de evidencia clínica en literatura científica (Vicomtech). Quiere dar una aproximación a la problemática de la búsqueda de evidencias clínicas en literatura científica. Implica un demostrador que permite realizar búsquedas semánticas en un conjunto de documentos científicos. Su portavoz será Montserrat Cuadros.

· Sistema de extracción automática y visualización 3D de moléculas en textos biomédicos (Grupo de investigación). Analiza textos de documentos biomédicos y detecta referencias a compuestos químicos mediante reconocimiento de entidades biomédicas nombradas. Permite visualizar en 3 dimensiones las estructuras moleculares detectadas, así como ver información semántica complementaria de ellas.Su portavoz será Enrique Puertas.

· TaxoMed (particular). Esta solución de tecnología semántica toma como entrada un término de nuevo cuño y opcionalmente una definición asociada y, mediante un algoritmo basado en representaciones vectoriales de palabras, devuelve una lista ordenada por confianza de sus posibles inserciones (conceptos altamente similares) en una terminología de referencia. Su portavoz será Luis Espinosa.

· CodeMyHealth (Everis Spain SLU). Propone la creación de un sistema capaz de procesar informes clínicos escritos en lenguaje natural e interpretarlos para realizar una codificación automática en un estándar internacional de terminología. Su portavoz será Alberto Algarra.

· BioAb Miner (Grupo de trabajo). Integra diferentes recursos de Procesamiento del Lenguaje Natural y Aprendizaje Automático para identificar abreviaciones y acrónimos en textos biomédicos, junto a las correspondientes formas extendidas que pueden ocurrir alrededor. Su portavoz será Francesco Ronzano.

· Sistema de Asistencia para el Registro de Información Médica (particular). Sistema conversacional para el registro de información de una visita al dentista, con una app móvil que, a través de la voz, recopila datos del paciente y sus alergias conocidas, registra el estudio y la intervención llevada a cabo, y los medicamentos a aplicar. También asiste en el registro y alerta de posibles incompatibilidades de los tratamientos propuestos con respecto a las alergias indicadas. Su portavoz será Pedro José Galera.

Premios y jurado

Los primeros clasificados de las dos categorías recibirán un premio de 3.000 euros, mientras que los segundos ganarán 2.000 euros y los clasificados en tercer lugar, 1.000.

De evaluar los proyectos se ocupa un jurado compuesto por perfiles provenientes de diferentes áreas de conocimiento e instituciones, con el objetivo de que en cada categoría haya una composición plural.

Las personas que integran el jurado de la categoría ‘Corpus General’ son: David Pérez (SESIAD), María Fernández Rancaño (Red.es), María Antonia Martí (SEPLN), Agustí Cerrillo (UOC), Agnès Ponsati (BNE), Maite Melero (ELRC), José Luis Fernández-Checa (Agencia EFE) y Juan Gascón (AMETIC).

En la categoría de ‘Biomedicina’ los miembros del jurado son: David Pérez (SESIAD), Juan Ramón González (Red.es), Martin Kralinger (CNIO), Marta Villegas (BSC), Arturo Romero (MSSSI), Monserrat Marimón (UPF), Juan Ignacio Godino (UPM) y Cristina Bojo (ISCIII).

Esta actividad se enmarca en el Plan de Impulso de las Tecnologías del Lenguaje y tiene como objetivo incentivar el talento, la capacidad técnica y la creatividad de los participantes; difundir las capacidades y las oportunidades de este subsector, y promocionar el trabajo en grupo y la colaboración entre los equipos participantes.

Colaboradores del II Hackathon

El II Hackathon de Tecnologías del Lenguaje cuenta con la colaboración de la Agencia Efe, el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) y el programa SciELO, a través del Instituto de Salud Carlos III.

Efe pone a disposición de los participantes un corpus de noticias de ámbito general que ya ha sido utilizado en otras ocasiones para el desarrollo de infraestructuras lingüísticas y que está organizado por temáticas. SciELO, por su parte, incorpora un corpus para la categoría de Biomedicina, con más de 745.000 artículos a disposición de los participantes. El BSC-CNS, asimismo, proporciona acceso a sus infraestructuras de HPC (High Perfomance Computing) y asesoramiento a los participantes en tecnologías del lenguaje.

TextDigester, ganadora de la I edición

En la I edición del Hackathon, celebrada hace un año, ganó la aplicación TextDigester, que permite analizar contenidos textuales de páginas HTML como las de un periódico, documentos XML como RSS feed y objetos JSON como los post de Twitter. Una vez detectado el idioma, ejecuta el análisis léxico y semántico de los documentos y, con esta información, implementa varios métodos para generar resúmenes en distintos idiomas.

Noticia
PLN
| Economía digital | Emprendimiento | Servicios públicos
El periodo de inscripciones se mantiene abierto hasta este 14 de diciembre

Tres colaboradores de lujo para el II Hackathon de Tecnología del Lenguaje: Efe, Centro Nacional de Supercomputación y SciELO

Los próximos 26 y 27 de febrero, en el marco del evento Four Years From Now de Barcelona, se celebrará la fase final del ‘II Hackathon de Tecnología del Lenguaje’ que organizan la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital (SESIAD) y Red.es. Con el objetivo de impulsar esta competición de desarrolladores especializados en Procesamiento del Lenguaje Natural (PLN) y la Traducción Automática, se han sumado a la iniciativa tres colaboradores de lujo: la Agencia Efe, el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) y el programa SciELO.

Agencia Efe: Corpus de noticias periodísticas

Efe, que es la primera agencia de noticias en español y la cuarta del mundo, participa en el Hackathon poniendo a disposición de los participantes un corpus de noticias periodísticas de ámbito nacional, elaboradas en la central de Madrid con el apoyo de las delegaciones, subdelegaciones y oficinas permanentes repartidas por todas las comunidades autónomas. Se trata de un corpus de contenidos, que ha sido ya empleado en otras ocasiones para el desarrollo de infraestructuras lingüísticas, y que se organiza por temáticas: política, economía, justicia, cultura, ciencia y tecnología, sucesos y sociedad. Cuenta también con metadatos relativos a entidades, geolocalización e International Press Telecommunications Council (IPTC), entre otros. Esta colaboración se enmarcaría en la categoría de Corpus Generales.

SciELO: Corpus de la categoría de Biomedicina

SciELO (Scientific Electronic Library Online) pone a disposición de los participantes un corpus en la categoría de Biomedicina. Esta red, con 20 años de existencia, cuenta con una amplia trayectoria en el campo de la difusión de la ciencia generada en países del ámbito latinoamericano. Está extendida por 13 países, dispone de 1.285 revistas científicas de todas las áreas del conocimiento, de las que 444 pertenecen a las ciencias de la salud y de ellas 60 están publicadas en nuestro país. Todo ello se traduce para los participantes en 745.182 artículos disponibles a texto completo y más de 13 millones de citas incluidas en ellos.

El corpus SciELO-España ha sido proporcionado por la Biblioteca Nacional de Ciencias de la Salud del Instituto de Salud Carlos III, principal organismo público dedicado a la investigación biomédica en España. Es además el organismo gestor de la Acción Estratégica en Salud en el marco del Plan Nacional de I+D+I. Adscrito orgánicamente al Ministerio de Industria, Economía y Competitividad y funcionalmente, tanto a este mismo como al Ministerio de Sanidad, Servicios Sociales e Igualdad, tiene como misión principal el fomento de la generación de conocimiento científico en ciencias de la salud y el impulso de la innovación en la atención sanitaria y en la prevención de la enfermedad.

Centro Nacional de Supercomputación: infraestructuras de HPC y asesoramiento

El Hackathon también cuenta con la colaboración del Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), que proporcionará tanto acceso a sus infraestructuras de HPC (High Perfomance Computing), como asesoramiento a los participantes en tecnologías del lenguaje. Próximamente, el centro será sede de una de las Oficinas Técnicas para el PlanTL.

El BSC-CNS se especializa en supercomputación (HPC) y tiene una doble misión: proporcionar infraestructura y servicios de supercomputación a científicos europeos, y generar conocimiento y tecnología para transferir a la economía y la sociedad. El BSC es un Centro de Excelencia Severo Ochoa y acoge la infraestructura de investigación Europea PRACE (Partnership for Advanced Computing in Europe). El centro también gestiona la Red Española de Supercomputación (RES). BSC también es un consorcio que incluye al Ministerio de Economía, Industria y Competitividad, el Departament d’Empresa i Coneixement de la Generalitat de Catalunya y la Universidad Politécnica de Catalunya – Barcelona Tech.

Plazo de inscripciones abierto hasta el 14 de diciembre

Esta II edición del Hackathon, como hemos visto, incorpora como principal novedad el establecimiento de dos categorías, ya que a la General se suma otra de Biomedicina. El concurso pretende incentivar el talento, la capacidad técnica y la creatividad de los participantes, así como difundir las capacidades y las oportunidades de este subsector, y promocionar el trabajo en grupo y la colaboración entre los equipos.

Las inscripciones, que se realizan a través de la sede electrónica de Red.es, permanecen abiertas hasta el próximo 14 de diciembre. El concurso se desarrollará en dos fases. La primera será online y la segunda presencial, en Four Years From Now.

En la categoría ‘Corpus Generales’ puede participar cualquier corpus que no pueda calificarse como del área de la salud y/o la biotecnología. La presentación de los 10 prototipos finalistas tendrá lugar el 26 de febrero. La de ‘Biomedicina’, por su parte, está destinada a corpus de especialidad pertenecientes a las áreas de salud y/o biotecnología. Los 10 prototipos finalistas se presentarán el 27 de febrero.

El Hackathon cuenta con un espacio web propio a través del que se facilitará el acceso a corpus y herramientas para el desarrollo de prototipos. En él también se publica información relevante sobre la competición.

El Plan de Impulso de las Tecnologías del Lenguaje de la Agenda Digital asume el reto de impulsar el sector del PLN y la traducción automática de forma coordinada, buscando sinergias y evitando la duplicidad de esfuerzos, conforme a las recomendaciones de la Comisión para la Reforma de las Administraciones Públicas (CORA).

Noticia
PLN
| Economía digital | 4YFN | Servicios públicos
Plan de Impulso de las Tecnologías del Lenguaje de la Agenda Digital

Convocado el II Hackathon de Tecnología del Lenguaje, que incorpora una nueva categoría de Biomedicina

Red.es, en colaboración con la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital (SESIAD), acaba de lanzar la convocatoria para participar en el II concurso ‘Hackathon de tecnología del lenguaje’, destinado a empresas e investigadores relacionados con el Procesamiento del Lenguaje Natural (PLN), la traducción automática y los sistemas conversacionales. Esta nueva edición incorpora como principal novedad el establecimiento de dos categorías, ya que a la general se suma otra de biomedicina.

La actividad se enmarca en el Plan de Impulso de las Tecnologías del Lenguaje y tiene como objetivo fomentar el desarrollo de aplicaciones y funcionalidades relacionadas con el PLN y la traducción automática en un corto periodo de tiempo. El concurso también pretende incentivar el talento, la capacidad técnica y la creatividad de los participantes; difundir las capacidades y las oportunidades de este subsector, y promocionar el trabajo en grupo y la colaboración entre los equipos participantes.

Los interesados pueden inscribirse a través de la sede electrónica de Red.es hasta el próximo 14 de diciembre. El concurso se desarrollará en dos fases. La primera será online y la segunda presencial, en el marco del evento Four Years From Now, que se celebrará en Barcelona del 26 al 28 de febrero, dentro de la agenda del Mobile World Congress.

En la categoría ‘Corpus Generales’ puede participar cualquier corpus que no pueda calificarse como del área de la salud y/o la biotecnología. La presentación de los 10 prototipos finalistas tendrá lugar el 26 de febrero. La de ‘Biomedicina’, por su parte, está destinada a corpus de especialidad pertenecientes a las áreas de salud y/o biotecnología. Los 10 prototipos finalistas se presentarán el 27 de febrero.

El Hackathon cuenta con un espacio web propio a través del que se facilitará el acceso a corpus y herramientas para el desarrollo de prototipos. En él también se publicará información relevante sobre la competición.

El Plan de Impulso de las Tecnologías del Lenguaje de la Agenda Digital asume el reto de impulsar el sector del PLN y la traducción automática de forma coordinada, buscando sinergias y evitando la duplicidad de esfuerzos, conforme a las recomendaciones de la Comisión para la Reforma de las Administraciones Públicas (CORA).

Noticia
PLN
| Corporativo | Economía digital | Servicios públicos
Congreso sobre Procesamiento del Lenguaje Natural en Murcia

José María Lassalle avanza las principales actuaciones del Plan de Impulso de Tecnologías del Lenguaje

El secretario de Estado para la Sociedad de la Información y la Agenda Digital (SESIAD), José María Lassalle, ha inaugurado hoy la Jornada de Debate sobre las aplicaciones de las Tecnologías del Lenguaje, celebrada hoy en Murcia, donde ha dado a conocer los principales avances que se están desarrollando, en nuestro país, en el marco del Plan de Impulso de las Tecnologías del Lenguaje.

Lassalle ha informado sobre los proyectos prioritarios de acción del Plan de Tecnologías del Lenguaje que se aplicarán en sectores estratégicos como la justicia, la sanidad, el turismo y la gestión de las ayudas públicas.

En concreto, el secretario de Estado ha anunciado la firma en fechas próximas de un acuerdo de colaboración con el Centro de Documentación Judicial del Consejo General del Poder Judicial (Cendoj) para abordar mediante tecnologías del lenguaje el tratamiento de las sentencias judiciales en España.

Además, en el ámbito sanitario, ha destacado la cooperación con las Comunidades Autónomas y el propio Ministerio de Sanidad, Servicios Sociales e Igualdad para crear herramientas de procesamiento de prospectos médicos y episodios clínicos que permitan soluciones útiles para profesionales sanitarios e investigadores.

En turismo, Lassalle ha explicado que se están elaborando sistemas de análisis de opinión y sistemas conversacionales que ayuden a la interpretación de comentarios y sugerencias para el sector turístico. 

Finalmente, en colaboración con otros ministerios, ha puntualizado que se está trabajando para optimizar y mejorar la eficiencia a la hora de distribuir ayudas en innovación o sistemas de subvenciones para empresas y centros de investigación.

Congreso sobre el Procesamiento del Lenguaje Natural

La Jornada de Debate, organizada por SESIAD y Red.es, se celebra coincidiendo con el XXXIII Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN 2017), que también tiene lugar, desde hoy y hasta el viernes, en la capital murciana. En ella participan más de 120 expertos y representantes de las distintas administraciones a través de ponencias y talleres.

Lassalle ha estado acompañado por el alcalde de Murcia, José Francisco Ballesta; el consejero de Hacienda y Administraciones Públicas de la Comunidad Autónoma de la Región de Murcia, Andrés Carrillo; el rector de la Universidad de Murcia, José Orihuela, y el presidente de la Sociedad Española de Procesamiento del Lenguaje Natural (SEPLN), Alfonso Ureña.