Disco duro abierto

Almacenamiento de datos a largo plazo en disco duro

El almacenamiento de datos a largo plazo no es un tema baladí. Los discos se deterioran con el tiempo, incluso aquellos a los que grabamos datos y que luego dejamos en un cajón.

Una posible solución pasa por grabar a disco duro los datos y guardar ese disco en un lugar seguro y en condiciones ideales de humedad y temperatura.

Aspectos a tener en cuenta en las copias de seguridad o backups

Los datos, además deberían estar cifrados y tendremos a varias personas al tanto de la clave. También es necesario un mecanismo de recuperación de datos protocolizado y probado de vez en cuando (al menos una vez al año) para ver que funciona y que el backup se está haciendo correctamente y lo podemos recuperar.

Hay que tener en cuenta tanto la auditoría de acceso a datos como la previsión para recuperar la clave en caso de fallecimiento del técnico encargado (o vacaciones, accidente, enfermedad, despido, detención o lo que pueda surgir).

Es más, si tus datos son tu empresa, valen mucho dinero o son de vital importancia, debes enviar varios discos con el mismo backup a distintos países situados en distintas placas tectónicas y con distinta situación geopolítica.

¿Es lo anterior una exageración?

Un ejemplo de pérdida de datos en empresas fueron los atentados contra las torres gemelas de Nueva York el 11 de septiembre de 2001, donde había empresas que guardaban sus datos en una de las torres y el backup o no lo tenían o lo guardaban en la otra. Se puede leer algo más del caso en este artículo de El País.

Imagen de un terremoto
Terremoto. Foto de: mauveine

A finales de agosto de 2020, con la situación actual en Bielorrusia ¿albergarías tus datos sólo allí? ¿Permitirías que una guerra paralizase tu negocio?

Como se ve, no me centro en el aspecto de pérdida de vidas humanas, ni en el caso de fallecimiento del técnico informático en el primer ejemplo, ni de los miles de trabajadores en el segundo. De hecho en los atentados del 11S, un presidente de una compañía de 700 trabajadores salvó su vida por llevar a su hija al colegio, pero a la vuelta, todos los trabajadores de su empresa perecieron (artículo de El Mundo).

Si hablamos de una empresa multinacional, la actividad no debería verse paralizada por lo que sucede en una parte del mundo, aunque sea terrible.

Otras alternativas

También se puede hacer el backup con cintas magnéticas o subirlo a la nube (S3, Glacier, Backblaze, Openstack Swift, etc) pero eso es otro tema aparte.

¿Y por qué no grabar a CD o DVD si he leído que duran más de 100 años? Por dos motivos: Los almacenamientos ópticos son mucho menos confiables y recuperar datos perdidos de un CD o DVD se antoja bastante más complicado (depende cual sea el motivo) porque la oferta que hasta ahora he visto de empresas dedicadas a ello de forma profesional (no absurda) es menor.

Un caso práctico desde el punto de vista del usuario o PYME

Vamos a imaginarnos un escenario más simple, una empresa (o nosotros) hacemos copias de seguridad y no nos importa gastarnos unos 60 € al año en comprarnos un disco externo USB cada año y hacer un backup a largo plazo (por si falla el principal).

Organizamos los discos por año y los metemos pegados a archivadores AZ y los guardamos en un armario cerrado con llave que está en nuestra oficina, que cuenta con deshumidificador y aire acondicionado. Ya hemos incumplido varias recomendaciones, como no tener un armario ignífugo, pero imaginemos que no es nuestra única copia y que somos una empresa pequeña.

Datos cifrados en almacenamiento a largo plazo
Y si cifras los datos, mejor.
Foto de thedigitalway-3008341

Pensamos ¡la copia de seguridad perfecta! Desconectada de internet y de cualquier ordenador (offline). No le afectan virus, errores de software o incluso errores humanos, mientras no cojamos de nuevo el disco. Ningún hacker puede acceder a esos datos, salvo que entre en nuestra casa/oficina.

Estamos seguros que en caso de catástrofe con los datos y la copia local (e incluso el la copia remota a la nube) puesto que utilizamos una estrategia 321 de backup, siempre tendremos nuestros datos y con menos de un año de antigüedad.

¿Problemas? ¡Allá vamos!

A fin de cuentas, la probabilidad que nos entren durante el fin de semana en la oficina, se lleven tanto discos como ordenadores (ahora con el auge del robo de identidad, los dispositivos de almacenamiento se han vuelto objeto de deseo de los cacos) hackeen uno, se hagan con las claves de la copia remota en la nube, la borren y nos extorsionen pidiéndonos dinero para recuperar los datos (y por tanto la actividad de la empresa) es muy baja ¿no?

Hackers
Foto de: bermixstudio

Bah, eso sólo pasa con el ransonware, eso que no sé lo que es y por tanto no me afecta:

¿Qué podría salir mal teniendo la copia de seguridad siempre conectada? ¿Podrían hacerse con el control de todo? He aquí el ejemplo:

Y no sólo eso, la noticia cuenta que la mitad de clientes no contrataban el backup, pero en su momento fue muy comentado que el error habría afectado también a la parte de backup.

El resultado fue suicidio, aunque también fue comentado que no habría sido el primer intento, cosa que desconozco, con lo que no podemos establecer la relación directa entre muerte y pérdida de datos, aunque parece el desencadenante de la situación:

Pero nuestro backup es bueno, confiable. No sólo eso, si borramos datos antiguos (de hace 10 años o más) siempre tendremos un archivo histórico.

¿O puede que no tengamos nuestros datos?

Según la Wikipedia (que yo no soy físico) la histéresis es la tendencia de un material a conservar una de sus propiedad en ausencia del estímulo que la ha causado.

En el caso de los discos magnéticos o mecánicos, la información que queda guardada en la superficie. Explicado grosso modo, los bits «pierden su magnetismo» y es que con la edad, todo se pierde.

Para entender cómo la información puede degradarse en un disco, hay que entender su funcionamiento.

¿Cómo funciona a nivel físico un disco duro?

Un disco duro mecánico (o magnético) consta de uno o varios platos que giran a una velocidad constante (antiguos) o variable (ahorro de energía). Esta velocidad se mide en RPM (Revoluciones por Minuto).

Las agujas y partes móviles, otro peligro en el almacenamiento a largo plazo
Disco duro mecánico: Platos y cabezas lectoras. Foto de: artwall_hd

No me voy a meter a nivel lógico lo que son pistas y sectores, porque no nos hace falta para entender el funcionamiento a nivel físico.

Cada vez que queremos escribir en un disco, «aplicamos» corriente en una zona «1» o la «quitamos» «0».

Los platos tienen propiedades ferromagnéticas y su material presenta histéresis ante este magnetismo. Pero un disco duro no es un imán permanente y puede perder sus propiedades, por ende, sus datos.

En la imagen podemos ver el esquema lógico de uno de los platos de un disco duro. Es una representación imaginaria de pistas, sectores, clústers y cilindros.

Estructura lógica de un disco. Pistas (A, en rojo) y sectores. Fuente: Wikipedia

Para conservar estos datos, con discos mecánicos o incluso los SSD, debemos reescribir estos datos para refrescarlos.

En los SSD el motivo dista del magnetismo, pero necesitan electricidad o los datos se degradarán a los dos años que el disco no tenga corriente (considerando temperatura de 30 ºC) y esta duración se acortará cuanto mayor sea la temperatura.

La realidad del los HDD (Hard Disk Drive) o discos duros mecánicos tradicionales es que:

  • La recuperación de datos suele ser más sencilla (tecnología conocida).
  • Los datos suelen conservarse durante más tiempo.
  • Son más sensibles a caídas y movimientos bruscos, sobre todo durante su funcionamiento.
  • Suelen ser más tolerables a temperaturas más altas.
  • Necesitan aire para funcionar o al menos tener un gas en su interior que facilite el intercambio de calor.

Poniéndonos técnicos ¡Refrescando los datos!

Existen dos herramientas muy sencillas, una para Microsoft Windows y otra para GNU/Linux.

Si prefieres simplemente copiar los archivos de un disco a otro y utilizar el anterior para el nuevo backup, también es un método válido, pues las herramientas lo único que harán es leer la información X y volver a escribirla.

Herramienta Windows DiskFresh:

http://www.puransoftware.com/DiskFresh.html

Winfresh es un programa gratuito que funciona en las versiones: XP/2003/Vista/2008/7/8/2012 (y soporta 64 bits). Lo único que hace es leer y escribir cada sector además de avisarte si detecta algún error en el disco, para que, en este caso lo cambies.

Comando GNU/Linux badblocks (con parámetro n, modo lecto-escritura no destructivo):

sudo badblocks -f -b 4096 -p 1 -c 32768 -nsv /dev/PARTITION

Lo mismo ocurre con badblocks, hace una escritura no destructiva, lee y escribe lo mismo.

Mecanismos de seguridad en memorias SD/Micro SD

Hablando de otros almacenamientos, cuando una memoria de tipo SD se estropea, normalmente antes (aunque no está garantizado y el almacenamiento en estos medios sin backup es extremadamente peligroso) se pone en modo de solo lectura.

Hay dos modos de sólo lectura, el estado del primero puede cambiarse con un software especial y un lector conectado directamente a la placa base del equipo (no valdría utilizar lectores con USB compuesto).

Modo sólo lectura:

  • Bit «blando», cambiable con interfaz directo placa-memoria SD.
  • Bit «duro» no cambiable, se queda en ese estado, pero al menos sigue dejando leer los datos.

Referencias adicionales que no están en el texto y puede ser interesantes:

Artículo relacionado: https://jfsanchez.es/2020/10/inicio-desde-usb-en-virtualbox-bajo-gnu-linux/

Foto principal de: Patrick Lindenberg