El curso se realizó los días 11 y 12 de agosto en Concepción y estuvo dirigido a estudiantes de postgrado, doctorado y magíster, además de postdocs. Álvaro Paredes, desarrollador Data Science de Data Observatory, compartió conocimientos acerca del uso de «R», como herramienta de análisis y procesamiento de imágenes satelitales, lo que es parte actualmente de nuestro trabajo sobre difusión y manejo de datos espaciales.
Como parte de un Ciclo de Talleres que desarrollan conjuntamente el Instituto Milenio en Socio-Ecología Costera (SECOS) y el Núcleo Milenio UPWELL, que estudia las relaciones co-evolutivas entre los sistemas socioculturales y biofísicos que han integrado el Sistema de Corriente Humboldt (SCH) de Chile durante los últimos 12.000 años; los días 11 y 12 de agosto, se realizó un curso en el que participó como expositor invitado Álvaro Paredes, desarrollador Data Science de Fundación Data Observatory.
Data Observatory es una colaboración público-privada-académica, sin fines de lucro, liderada por el Ministerio de Ciencia, Tecnología, Innovación y Conocimiento y el Ministerio de Economía, Fomento y Turismo, creada junto a Amazon Web Services (AWS) y la Universidad Adolfo Ibáñez (UAI). Su misión es la de adquirir, almacenar, procesar, analizar y disponibilizar conjuntos de datos de gran volumen y calidad, para contribuir al desarrollo de conocimiento, ciencia, tecnología e innovación, gracias a la ciencia de datos y la IA.
El curso se realizó los días 11 y 12 de agosto en Concepción y estuvo dirigido a estudiantes de postgrado, doctorado y magíster, además de postdocs. La actividad formativa fue en formato presencial y consideró clases dictadas por los investigadores jóvenes de Upwell, Matías Frugone y Carlos Lara – también investigador colaborador del SECOS-, y Álvaro Paredes, Investigador de Fundación Data Observatory. También participaron Marcelo Rivadeneira, investigador del Centro Científico CEAZA y Bernardo Broitman, académico de la Universidad Adolfo Ibáñez e investigador SECOS y Upwell.
La mayoría de los repositorios a utilizar provienen de diversas plataformas satelitales. El primer día, el curso abordó el procesamiento de imágenes satelitales (extraídas desde Google Earth Engine (GEE)) por medio del software R, mientras que el segundo día se enfocó en repositorios de datos paleoambientales y/o paleoceanográficos (LiPID, NOAA, etc) y su análisis, usando el mismo programa. Asimismo, los estudiantes se familiarizaro con repositorios enfocados en el intercambio de información como GitHub, Dryad, Mendely, entre otros.
Bernardo Broitman, investigador SECOS y Upwell, señaló que: «Uno de los grandes desafíos de la interdisciplina en ciencias básicas es poder utilizar diversos datos de forma FAIR (por su siglas en inglés Findability, Accessibility, Interoperability, and Reusability), permitiendo que los datos que generamos en nuestras investigación individuales puedan trascender en el tiempo, aumentando de esta forma su impacto y asegurando el buen uso de los recursos públicos que financiaron su generación. Existe un esfuerzo emergente por parte de la ANID en impulsar los estándares FAIR en el país, de manera que este taller pone a ambos centros Milenio (SECOS y Upwell) en la vanguardia de la ciencia interdisciplinaria del futuro próximo».
Pese a que el curso no trató específicamente sobre repositorios, el académico sostuvo que las técnicas analíticas enseñadas involucran, o derechamente dependen, del acceso a repositorios de información online, lo que si bien es algo bastante común en disciplinas como la oceanografía, astronomía o geología, donde constantemente se generan vastos volúmenes de información, su adopción en la arqueología, ecología o biogeoquímica es relativamente reciente.
Broitman comentó que este tipo de iniciativas incentivan a la comunidad científica a utilizar el Data Observatory, ya que esta ciberinfraestructura es capaz de adquirir, almacenar, procesar analizar y disponibilizar conjuntos de datos de gran volumen y calidad, lo que sin duda abre oportunidades de colaboración e innovación interdisciplinaria.
Álvaro Paredes, desarrollador Data Science de Data Observatorio (DO), añadió: «Fue una gran experiencia como parte del equipo DO, compartir conocimientos acerca del uso de «R», como herramienta de análisis y procesamiento de imágenes satelitales, lo que es parte actualmente de nuestro trabajo en el proyecto DO «Open Data Cube», junto a la agencia de investigación australiana CSIRO y UAI. R es un lenguaje de programación similar a otros como Python y lo ocupan principalmente estadísticos, por sus cualidades de usabilidad, visualización y análisis de procesos, permitiendo extraer datos y gráficos, índices espectrales, aplicar filtros, entre otras de sus bondades».
El curso buscó cultivar una comunidad de jóvenes científicos y científicas que conozcan y adopten los principios FAIR desde temprano en sus carreras, ya que gran parte de la literatura está requiriendo su uso o los van a requerir en el futuro cercano, sobre todo en los journals de mayor impacto, donde se espera que todos los datos y softwares utilizados se disponibilicen junto con el manuscrito. Es más, existen journals de muy alto impacto, como Nature Scientific Data, que están dedicados a la publicación de grandes bases de datos, abriendo nuevos horizontes a las próximas generaciones de profesionales e investigadores.