Skip to Main Content (Press Enter)

Logo UNITO
  • ×
  • Home
  • Pubblicazioni
  • Progetti
  • Persone
  • Competenze
  • Settori
  • Strutture
  • Terza Missione

UNI-FIND
Logo UNITO

|

UNI-FIND

unito.it
  • ×
  • Home
  • Pubblicazioni
  • Progetti
  • Persone
  • Competenze
  • Settori
  • Strutture
  • Terza Missione
  1. Pubblicazioni

Accessible data curation and analytics for international-scale citizen science datasets

Articolo
Data di Pubblicazione:
2021
Abstract:
The Covid Symptom Study, a smartphone-based surveillance study on COVID-19 symptoms in the population, is an exemplar of big data citizen science. As of May 23rd, 2021, over 5 million participants have collectively logged over 360 million self-assessment reports since its introduction in March 2020. The success of the Covid Symptom Study creates significant technical challenges around effective data curation. The primary issue is scale. The size of the dataset means that it can no longer be readily processed using standard Python-based data analytics software such as Pandas on commodity hardware. Alternative technologies exist but carry a higher technical complexity and are less accessible to many researchers. We present ExeTera, a Python-based open source software package designed to provide Pandas-like data analytics on datasets that approach terabyte scales. We present its design and capabilities, and show how it is a critical component of a data curation pipeline that enables reproducible research across an international research group for the Covid Symptom Study.
Tipologia CRIS:
03A-Articolo su Rivista
Elenco autori:
Murray B.; Kerfoot E.; Chen L.; Deng J.; Graham M.S.; Sudre C.H.; Molteni E.; Canas L.S.; Antonelli M.; Klaser K.; Visconti A.; Hammers A.; Chan A.T.; Franks P.W.; Davies R.; Wolf J.; Spector T.D.; Steves C.J.; Modat M.; Ourselin S.
Autori di Ateneo:
VISCONTI Alessia
Link alla scheda completa:
https://iris.unito.it/handle/2318/1953033
Link al Full Text:
https://iris.unito.it/retrieve/handle/2318/1953033/1231354/Murray2021COVID.pdf
Pubblicato in:
SCIENTIFIC DATA
Journal
  • Dati Generali
  • Aree Di Ricerca

Dati Generali

URL

https://www.nature.com/articles/s41597-021-01071-x

Aree Di Ricerca

Settori (22)


LS7_14 - Digital medicine, e-medicine, medical applications of artificial intelligence - (2022)

LS7_9 - Public health and epidemiology - (2022)

PE1_19 - Scientific computing and data processing - (2022)

CIBO, AGRICOLTURA e ALLEVAMENTI - Farmacologia Veterinaria

CIBO, AGRICOLTURA e ALLEVAMENTI - Patologia e malattie degli animali

CIBO, AGRICOLTURA e ALLEVAMENTI - Scienze cliniche veterinarie

MEDICINA, SALUTE e BENESSERE - Diagnostica e Imaging

MEDICINA, SALUTE e BENESSERE - Disturbi neuropsichiatrici

MEDICINA, SALUTE e BENESSERE - Epidemiologia

MEDICINA, SALUTE e BENESSERE - Malattie neurologiche e neurodegenerative

MEDICINA, SALUTE e BENESSERE - Management del malato e delle malattie

MEDICINA, SALUTE e BENESSERE - Medicina Rigenerativa e Cellule Staminali

MEDICINA, SALUTE e BENESSERE - Oncologia e Tumori

MEDICINA, SALUTE e BENESSERE - Prevenzione e corretti stili di vita

MEDICINA, SALUTE e BENESSERE - Psicologia clinica

MEDICINA, SALUTE e BENESSERE - Ricerca Traslazionale e Clinica

MEDICINA, SALUTE e BENESSERE - Trapianti e medicina rigenerativa

PIANETA TERRA, AMBIENTE, CLIMA, ENERGIA e SOSTENIBILITA' - Diritto dell'Ambiente

PIANETA TERRA, AMBIENTE, CLIMA, ENERGIA e SOSTENIBILITA' - Informatica e Ambiente

SCIENZE DELLA VITA e FARMACOLOGIA - Interazioni tra molecole, cellule, organismi e ambiente

SCIENZE DELLA VITA e FARMACOLOGIA - Molecole bioattive

SCIENZE DELLA VITA e FARMACOLOGIA - Sviluppo del sistema nervoso e plasticità
  • Utilizzo dei cookie

Realizzato con VIVO | Designed by Cineca | 25.6.1.0