La preservación digital consiste en una serie de políticas, estrategias y acciones cuyo propósito es garantizar el acceso a los contenidos digitales, independientemente de los cambios tecnológicos. El objetivo de la preservación digital es asegurar que la información digital sigue siendo accesible y permanece utilizable a medida que los avances tecnológicos hacen que la especificación original de hardware y software sea obsoleta, lo que implica la planificación, la asignación de recursos y la aplicación de métodos y tecnologías de preservación.
Qué es la preservación digital
La rapidez con la que se presentan los cambios tecnológicos ha llevado al desarrollo del concepto de preservación digital, que consiste en buscar soluciones que permitan la preservación de documentos digitales a través del tiempo, indiferentemente de cuál haya sido el software, hardware o formato en el que hayan sido creados. La preservación digital es un esfuerzo formal para asegurar que la información digital permanece accesible y utilizable a lo largo del tiempo, a medida que los avances tecnológicos hacen obsoleto el hardware y la especificación de software originales.
Con el paso del tiempo y con la rapidez que se presentan los avances tecnológicos, muchos formatos, equipos y programas se vuelven obsoletos, quedando en riesgo de perderse mucha información valiosa. La preservación digital es la búsqueda de soluciones que permitan mantener dicha información de una forma que puede ser visualizada y usada, tanto si se trata de contenido reformateado como de contenido “nacido digital”.
En la actualidad existe una gran cantidad de información en forma digital, incluyendo correos electrónicos, blogs, redes sociales, sitios web, fotos, vídeos, música, etc. Con los medios digitales es más fácil crear contenido y mantenerlo al día, pero al mismo tiempo hay muchos retos en la preservación de este contenido, tanto técnicos como económicos.
A diferencia de los objetos analógicos tradicionales, tales como libros o fotografías en las que el usuario tiene un acceso inmediato al contenido, un documento digital siempre necesita un entorno de software para renderizarlo. Estos entornos siguen evolucionando y cambiando a un ritmo acelerado, amenazando la continuidad de la capacidad de acceso al contenido. Los medios físicos de almacenamiento, los formatos de datos, el hardware y el software se vuelven obsoletos con el tiempo, lo que representa una seria amenaza para la supervivencia del contenido. Este proceso se denomina obsolescencia digital.
En el caso del contenido “nacido digital” (por ejemplo, archivos ofimáticos, sitios web, contenido electrónico de audio y vídeo, fotografía digital, conjuntos de datos de investigación o datos de observación), la enorme y creciente cantidad de contenido representa un importante problema de escala para los esfuerzos de preservación digital. Las tecnologías cambian tan rápidamente que pueden obstaculizar el trabajo de los preservacionistas digitales debido a las máquinas anticuadas o la tecnología anticuada.
Para la preservación del software como contenido digital, un desafío específico es que por lo general el código fuente no está disponible, ya que el software comercial normalmente se distribuye sólo en forma binaria compilada. Sin el código fuente, a menudo es imposible portar el software a un hardware o sistema operativo moderno, por lo que el contexto original de hardware y software debe ser emulado.
En la preservación digital también supone un gran desafío el coste económico, ya que los proyectos de preservación requieren una inversión inicial significativa para crear el sistema, junto con los costes de la adquisición de datos, la administración de datos, el almacenamiento de datos y la dotación de personal.
Veamos algunos de los componentes clave de la preservación digital:
- Evaluación: La evaluación se refiere al proceso de identificación, valoración, priorización y selección de los materiales que se deben conservar. La evaluación se debe realizar en todos los materiales de archivo, no sólo digitales. La evaluación de los materiales debe ser cuidadosamente considerada en relación con la capacidad de la organización para manejar dichos materiales.
- Identificación: En la preservación digital, la identificación de los objetos se realiza mediante el uso de identificadores y metadatos descriptivos. Un identificador es una etiqueta alfanumérica única que se utiliza para hacer referencia a un objeto. Los metadatos descriptivos se refieren a información sobre el contenido de un objeto, como el título, el creador, el sujeto, la fecha, etc. Otro tipo común de identificador es el nombre del archivo, siendo esencial implementar un protocolo de nomenclatura de archivos para mantener la consistencia del sistema, especialmente durante la digitalización de medios analógicos.
- Integridad: En la preservación digital, la integridad de los datos se refiere a la garantía de que los datos son completos e inalterados en todos sus aspectos esenciales, garantizando que los datos son los mismos que se grabaron originalmente. Se deben implementar estrategias para detectar cambios y reaccionar de manera apropiada. El principal mecanismo para monitorear la integridad de los datos son las sumas de comprobación (checksum).
- Sostenibilidad: La sostenibilidad digital se refiere a las tareas de mantenimiento necesarias para la preservación digital que faciliten el acceso y la disponibilidad en el futuro. Se deben adoptar medidas para contrarrestar la obsolescencia de los medios físicos, del hardware, del software y de los formatos de archivo.
- Autenticidad: La autenticidad se refiere a garantizar que los datos son lo que pretenden ser y que están libres de manipulación o corrupción, y que no ha sido alterados respecto a lo que se recibió originalmente.
En cuanto a las estrategias de preservación digital, hay varias estrategias que se pueden usar para combatir activamente la pérdida de información digital, algunas son las siguientes:
- Metadatos: Cuando se crea un documento se le agregan metadatos que brindan información importante sobre el propio documento. Existen dos tipos de metadatos: los descriptores, que incluyen información diversa sobre el documento, y los de conservación, que informan acerca de cómo acceder a los datos.
- Refresco: Refrescar es la transferencia de datos entre dos soportes del mismo medio de almacenamiento para que no haya alteración de datos. Probablemente el refresco siempre sea necesario, debido al deterioro de los medios físicos.
- Replicación: La creación de copias duplicadas de datos en uno o más sistemas se denomina replicación. Los datos que existen como una sola copia en una sola ubicación son altamente vulnerables a cualquier fallo, mientras que los datos digitales tienen más probabilidades de sobrevivir si se replican en varios lugares.
- Preservación de la tecnología: Esta estrategia consiste en hacer un mantenimiento del hardware y del software, aunque a largo plazo esto puede no funcionar, ya que con el paso de los años será cada vez más complicado conseguir repuestos y la maquina terminará siendo obsoleta.
- Migración: La migración es la transferencia de datos a sistemas más recientes, lo que puede incluir la conversión de un formato de archivo a otro, de un sistema operativo a otro o de un programa de renderización a otro, para que el recurso siga siendo totalmente accesible y funcional. Con este proceso se mantienen las características más importantes de los documentos, pero se pueden presentar pequeños cambios que a la larga pueden generar inconvenientes por acumulación, por lo que los datos pueden llegar a ser inaccesibles debido a obsolescencia de medios y hardware o la degradación.
- Emulación: La emulación es la replicación de la funcionalidad de un sistema obsoleto, y consiste en crear un entorno de software que se comporte de manera similar al original con el que se generaron los documentos y que proporcione completa accesibilidad.
- Encapsulación: Este método consiste en que los objetos preservados sean autodescriptivos, vinculando el contenido con toda la información necesaria para que pueda ser descifrado y comprendido.