Arquelogía de datos

La arqueología de datos se ocupa de recuperar datos informáticos almacenados en medios o formatos obsoletos, dañados, degradados, cifrados o irrecuperables con los métodos convencionales. En la arqueología de datos se debe distinguir entre recuperación de datos e inteligibilidad de los datos. Para que la arqueología de datos sea efectiva, no sólo se deben recuperar los datos, además deben ser inteligibles. Para evitar la necesidad de la arqueología de datos, los creadores y titulares de documentos digitales deben emplear técnicas de preservación digital.

Arqueologia de datos

Qué es la arqueología de datos

La arqueología de datos hace referencia a la ciencia de la recuperación de datos de ordenadores o dispositivos de almacenamiento, cuando estos se encuentran en medios o formatos obsoletos. La arqueología de datos también puede usarse para referirse a la recuperación de datos en equipos que han sido afectados por desastres naturales o generados por la acción del hombre.

Este término se viene usando desde el año 1993 por la iniciativa de la Global Oceanographic Data Archaeology and Rescue Project (GODAR) para recuperar registros computerizados almacenados en viejas cintas de computadora, que contienen información sobre el clima en otras épocas y que pueden resultar de utilidad en diferentes teorías sobre el cambio climático. Por ejemplo, entre los datos recuperados está una imagen del Ártico de alta resolución realizada por el satélite Nimbus 2 en el año 1966.

La NASA también ha recurrido a los servicios de los arqueólogos de datos en el proyecto Lunar Orbiter Image Recovery Project, una iniciativa para recuperar y digitalizar viejas fotografías tomadas en los años 60 por satélites que orbitaron la Luna, que se encuentran almacenadas en antiguas cintas de computadora incompatibles con los ordenadores comunes de la actualidad. En la explosión del transbordador espacial Challenger en 1986, los científicos de la NASA pudieron recuperar más del 99% de los datos que contenía el transbordador, a pesar de que las cintas magnéticas donde se almacenaban los datos cayeron al océano y se impregnaron de agua salada.

En la arqueología de datos es importante distinguir entre recuperación de datos e inteligibilidad de los datos. Es posible que se puedan recuperar los datos, pero no entenderlos. Para que la arqueología de los datos sea efectiva, los datos deben ser inteligibles.

La arqueología de datos no se queda en la simple recuperación de la información, de cierta forma muchas personas pueden ser capaces de recuperar datos, pero no en todos los casos estos son inteligibles. Para la arqueología de datos es muy importante la inteligibilidad de los datos recuperados, la recuperación debe permitir la comprensión de los datos.

Los arqueólogos de datos no solo son eficaces en la recuperación de datos almacenados en medios obsoletos, también son capaces de recuperar información de equipos dañados por un desastre natural o de origen humano. Normalmente tras un desastre, tal como una inundación o un incendio, un terremoto o un huracán, mucho hardware que se ve afectado deja de ser operativo, ahí es donde entran los arqueólogos de datos, para recuperar los equipos de manera correcta y extraer los datos reduciendo la pérdida de información.

Los motivos que pueden impedir acceder a datos digitales son variados. Uno de ellos es la degradación física, que puede ser debida a factores como el almacenaje en condiciones de alta temperatura, con demasiada humedad o en presencia de materiales magnéticos o corrosivos. También los desastres, como inundaciones, terremotos o inundaciones pueden dañar físicamente el soporte, así como el uso excesivo.

Uno de las principales causas que dificultan al acceso a los datos es la antigüedad, tanto del hardware como del software. En ocasiones de trata de tecnologías obsoletas, no soportada por el nuevo hardware ni por los nuevos sistemas operativos. En caso de averías por el uso o por defectos de fabricación, no se encuentran repuestos disponibles debido a su antigüedad.

En muchos casos, a pesar de que se puede acceder a los datos, no se puede interpretarlos, debido a que el sistema de codificación es desconocido, los datos están cifrados y no se dispone de la clave, los ficheros se han comprimido con algoritmos de compresión desconocidos o porque los dispositivos que se utilizaban para mostrar la información (por ejemplo displays específicos) ya no están disponibles.

En cuanto al método de recuperación de los datos, dependerá de cuál es el motivo que impide el acceso a los mismos. Al decidir si intentar o no recuperar los datos, uno de los aspectos que debe ser tenido en cuenta es el coste del proceso. Si hay suficiente tiempo y dinero, es más probable poder recuperar una mayor cantidad de datos.