Buscar

Mostrando entradas con la etiqueta kaggle. Mostrar todas las entradas
Mostrando entradas con la etiqueta kaggle. Mostrar todas las entradas

2020/03/17

COVID-19 Open Research Dataset (CORD-19): Miles de artículos para investigadores en Kaggle


Con el fin de enfrentar a la pandemia del nivel coronavirus la Casa Blanca y una coalición de grupos de investigación líderes han preparadado el COVID-19 Open Research Dataset (CORD-19), un desafío que incluye un juego de datos conformado por más de 29 mil artículos académicos de los cuales más de 13 mil están íntegramente incluidos (full text), todos ellos sobre el COVID-19, SARS-CoV-2 y coronavirus parecidos.

La Casa Blanca y las organizaciones mundiales que velan por la salud están buscando el apoyo de investigadores en todo el mundo para desarrollar herramientas para texto y minería de datos que puedan ayudar a la comunidad médica a responder preguntas de alta prioridad científica.

La comunidad global de investigadores pueden aplicar sus más recientes avances en procesamiento del lenguaje natural y otras técnicas de Inteligencia Artificial para generar nuevos puntos de vista en el soporte para la lucha contra las enfermedades infecciosas.

La publicación del Dataset, que pesa unos 2GB, está disponible a través de Kaggle y periódicamente irá aumentando. Para acceder a actualizacion o fragmentos del mismo se puede entrar a https://pages.semanticscholar.org/coronavirus-research

Kaggle está auspiciando con premios de mil dólares a los logros que aporten criterios significativos e impactantes para el desafio. Los ganadores pueden optar por recibir el premio o darlo como donación a investigaciones relacionadas a COVID-19.


Allen Institute for AI en alianza con la Iniciativa Chan Zuckerberg, el Centro para la Seguridad y Tecnolgías Emergentes de la Universidad de Georgetown, Microsoft Research y la Biblioteca Nacional de Medicina-Instituto Nacional de la Salud de los EEUU en coordinación con la Oficina de Políticas de Ciencia y Tecnología de la Casa Blanca.

Actualización: Al día 23 de marzo el dataset ya suma 4 GB.