GitHub creará una imagen TAR de cada repositorio público activo y la mantendrá en una Bóveda Ártica

noviembre 24, 2019 , 0 Comments

arctic code vault

GitHub quiere asegurarse que parte del conocimiento global que está almacenado en discos duros, SSD (cuya vida teórica de 30 años supone un calor y humedad estrictamente controlados) quede almacenado de manera segura. Y es que quiere contribuir a la resolución de este problema y otros como la ocurrencia de desastres que probablemente causen la pérdida de los contenidos.

Es por ello que lanzo el proyecto “Artic Code Vault” en la cual la idea detrás de esto es guardar el contenido de los repositorios en un medio de almacenamiento que tenga una vida útil más larga. Piql, una compañía noruega especializada en almacenamiento de datos a muy largo plazo, es responsable de suministrar y codificar esos datos en una pelicula. La tecnología de la película se basa en haluros de plata y poliéster.

Ya que los servidores y las unidades flash no son lo suficientemente resistentes para este propósito, por lo que los datos se codifican en lo que parecen carretes de películas de la vieja escuela, cada uno pesa unas pocas libras y se almacenan en un recipiente de plástico blanco del tamaño de una caja de pizza. Básicamente es microfilm.

Según las mediciones ISO, este material tiene una vida útil de 500 años. Las pruebas de envejecimiento simuladas indican que la película Piql durará el doble.

Con ello GitHub planea alojar las cintas en una mina de carbón desmantelada que esta ubicada en el archipiélago de Svalbard, el archivo está más cerca del Polo Norte que del Círculo Polar Ártico.

La misma ciudad es el hogar de una cámara fría global. Es una de las ciudades más septentrionales del planeta. Los archiveros opinan que el frío y las condiciones casi constantes contribuirán favorablemente a la preservación de los contenidos.

El 2 de febrero de 2020, GitHub creará una imagen TAR de cada repositorio público activo y la mantendrá en la Bóveda del Código del Ártico. El archivo incluirá elementos de la rama predeterminada de cada repositorio, excluyendo cualquier archivo binario de más de 100 kilobytes. Para una mayor densidad e integridad de datos, la mayoría de los datos se almacenarán como un código QR. Un índice y una guía legibles por humanos detallarán la ubicación de cada repositorio y explicarán cómo recuperar los datos.

 

Luego, la plataforma planea multiplicar la duración de la copia de seguridad de contenido por 10. GitHub ha iniciado una asociación con Microsoft Research en esta dirección por hasta 10,000 años. Para lograr esto, los equipos de investigación tienen la intención de “escribir el contenido en bandejas de vidrio de cuarzo utilizando láseres de femtosegundo.

El Artic Code Vault es parte de un programa de archivo de puesta en marcha por GitHub con un número de socios que incluye el Archivo de Internet, Microsoft Research y la Long Now Foundation. La estrategia se reduce a “archivar contenido en varias organizaciones de acuerdo con la recomendación de LOCKS: muchas copias mantienen las cosas seguras“.

La estrategia de respaldo está organizada en lotes los cuales se actualizarán en tiempo real. Por ejemplo, en el nivel de GitHub, los datos se transferirán inmediatamente a múltiples centros de datos en todo el mundo. Mientras que por otra parte se manejaran otros tipos de lotes que se actualizarán mensualmente o anualmente. Finalmente, lo que se almacenara en esta propuesta, en la que encontramos el Artic Code Vault se actualizará cada 5 años como mínimo.

“Nuestra misión principal es preservar el software libre para las generaciones futuras. También tenemos la intención de que el Programa GitHub Archive sea un testimonio de la importancia de la comunidad de código abierto. Esperamos que, hoy y en el futuro, genere conciencia sobre el movimiento global de Código Abierto, ya que contribuirá a una mayor adopción de políticas de Código Abierto y Datos Abiertos en el mundo entero y alentar el pensamiento a largo plazo “, escribe GitHub.

Si quieres conocer más al respecto sobre el proyecto de Artic Code Vault puedes consultar el siguiente enlace.


Some say he’s half man half fish, others say he’s more of a seventy/thirty split. Either way he’s a fishy bastard.