Se encuentra usted aquí

Noticia
PLN
| Economía digital | Emprendimiento | Servicios públicos
El periodo de inscripciones se mantiene abierto hasta este 14 de diciembre

Tres colaboradores de lujo para el II Hackathon de Tecnología del Lenguaje: Efe, Centro Nacional de Supercomputación y SciELO

I Hackathon Tecnología del Lenguaje

Los próximos 26 y 27 de febrero, en el marco del evento Four Years From Now de Barcelona, se celebrará la fase final del ‘II Hackathon de Tecnología del Lenguaje’ que organizan la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital (SESIAD) y Red.es. Con el objetivo de impulsar esta competición de desarrolladores especializados en Procesamiento del Lenguaje Natural (PLN) y la Traducción Automática, se han sumado a la iniciativa tres colaboradores de lujo: la Agencia Efe, el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) y el programa SciELO.

Agencia Efe: Corpus de noticias periodísticas

Efe, que es la primera agencia de noticias en español y la cuarta del mundo, participa en el Hackathon poniendo a disposición de los participantes un corpus de noticias periodísticas de ámbito nacional, elaboradas en la central de Madrid con el apoyo de las delegaciones, subdelegaciones y oficinas permanentes repartidas por todas las comunidades autónomas. Se trata de un corpus de contenidos, que ha sido ya empleado en otras ocasiones para el desarrollo de infraestructuras lingüísticas, y que se organiza por temáticas: política, economía, justicia, cultura, ciencia y tecnología, sucesos y sociedad. Cuenta también con metadatos relativos a entidades, geolocalización e International Press Telecommunications Council (IPTC), entre otros. Esta colaboración se enmarcaría en la categoría de Corpus Generales.

SciELO: Corpus de la categoría de Biomedicina

SciELO (Scientific Electronic Library Online) pone a disposición de los participantes un corpus en la categoría de Biomedicina. Esta red, con 20 años de existencia, cuenta con una amplia trayectoria en el campo de la difusión de la ciencia generada en países del ámbito latinoamericano. Está extendida por 13 países, dispone de 1.285 revistas científicas de todas las áreas del conocimiento, de las que 444 pertenecen a las ciencias de la salud y de ellas 60 están publicadas en nuestro país. Todo ello se traduce para los participantes en 745.182 artículos disponibles a texto completo y más de 13 millones de citas incluidas en ellos.

El corpus SciELO-España ha sido proporcionado por la Biblioteca Nacional de Ciencias de la Salud del Instituto de Salud Carlos III, principal organismo público dedicado a la investigación biomédica en España. Es además el organismo gestor de la Acción Estratégica en Salud en el marco del Plan Nacional de I+D+I. Adscrito orgánicamente al Ministerio de Industria, Economía y Competitividad y funcionalmente, tanto a este mismo como al Ministerio de Sanidad, Servicios Sociales e Igualdad, tiene como misión principal el fomento de la generación de conocimiento científico en ciencias de la salud y el impulso de la innovación en la atención sanitaria y en la prevención de la enfermedad.

Centro Nacional de Supercomputación: infraestructuras de HPC y asesoramiento

El Hackathon también cuenta con la colaboración del Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), que proporcionará tanto acceso a sus infraestructuras de HPC (High Perfomance Computing), como asesoramiento a los participantes en tecnologías del lenguaje. Próximamente, el centro será sede de una de las Oficinas Técnicas para el PlanTL.

El BSC-CNS se especializa en supercomputación (HPC) y tiene una doble misión: proporcionar infraestructura y servicios de supercomputación a científicos europeos, y generar conocimiento y tecnología para transferir a la economía y la sociedad. El BSC es un Centro de Excelencia Severo Ochoa y acoge la infraestructura de investigación Europea PRACE (Partnership for Advanced Computing in Europe). El centro también gestiona la Red Española de Supercomputación (RES). BSC también es un consorcio que incluye al Ministerio de Economía, Industria y Competitividad, el Departament d’Empresa i Coneixement de la Generalitat de Catalunya y la Universidad Politécnica de Catalunya – Barcelona Tech.

Plazo de inscripciones abierto hasta el 14 de diciembre

Esta II edición del Hackathon, como hemos visto, incorpora como principal novedad el establecimiento de dos categorías, ya que a la General se suma otra de Biomedicina. El concurso pretende incentivar el talento, la capacidad técnica y la creatividad de los participantes, así como difundir las capacidades y las oportunidades de este subsector, y promocionar el trabajo en grupo y la colaboración entre los equipos.

Las inscripciones, que se realizan a través de la sede electrónica de Red.es, permanecen abiertas hasta el próximo 14 de diciembre. El concurso se desarrollará en dos fases. La primera será online y la segunda presencial, en Four Years From Now.

En la categoría ‘Corpus Generales’ puede participar cualquier corpus que no pueda calificarse como del área de la salud y/o la biotecnología. La presentación de los 10 prototipos finalistas tendrá lugar el 26 de febrero. La de ‘Biomedicina’, por su parte, está destinada a corpus de especialidad pertenecientes a las áreas de salud y/o biotecnología. Los 10 prototipos finalistas se presentarán el 27 de febrero.

El Hackathon cuenta con un espacio web propio a través del que se facilitará el acceso a corpus y herramientas para el desarrollo de prototipos. En él también se publica información relevante sobre la competición.

El Plan de Impulso de las Tecnologías del Lenguaje de la Agenda Digital asume el reto de impulsar el sector del PLN y la traducción automática de forma coordinada, buscando sinergias y evitando la duplicidad de esfuerzos, conforme a las recomendaciones de la Comisión para la Reforma de las Administraciones Públicas (CORA).