- Apr 2024
-
www.practicereproducibleresearch.org www.practicereproducibleresearch.org
-
De manera similar, la portabilidad del flujo de trabajo sigue siendo un desafío para quienes buscan la apertura, ya que el empaquetado (especialmente la instalación de dependencias) sigue siendo un obstáculo crítico para compartir y ampliar el trabajo.
Frente al flujo de datos, traigo algunos aportes de la CEPAL.
Uno los aspectos que será necesario considerar desde el momento en que se planifique la investigación, es la forma en la cual se almacenarán los datos que serán generados o recopilados.
Algunos de los tipos de solución más comunes que se pueden utilizar durante y después de la investigación son:
-
Almacén de datos personal o del proyecto (por ejemplo, utilizando discos USB, discos duros de laptops o unidades en red dentro de la institución)
-
Repositorio institucional
-
Almacén de datos institucional
-
Infraestructura de almacenamiento nacional
-
Almacén de datos en la nube
-
Repositorio disciplinar
Cada vez con más frecuencia, personas e instituciones están optando por utilizar servicios de respaldo en línea, utilizando servicios en la nube. Ante esta alternativa, es importante considerar sus ventajas y desventajas y estudiar de qué manera estas apoyan o difieren de las necesidades de la institución o grupo de investigadores.
Respaldo de los datos
-
Establecer una política formal que especifique la periodicidad y las características de los procedimientos de respaldo de datos e información
-
Mantener al menos 3 copias de los sets de datos y toda la información relevante. Las copias deben almacenarse en al menos 2 soportes distintos, y al menos una de las copias debe estar en una locación diferente al recinto donde se almacenan las demás.
-
Al planificar los respaldos, considerar aspectos tales como:
- Métodos/herramientas que se utilizarán para el respaldo
- Qué datos serán respaldados (todos los datos, solo los procesados, etc.)
- Espacio de almacenamiento que será necesario
- Tiempo durante el cual se mantendrán los respaldos, condiciones de seguridad y destrucción cuando sea necesario
- Periodicidad de chequeos o verificación de acceso e integridad de los datos
- Software o métodos que se utilizarán para mantener control sobre las copias
-
-