虽然大多数IT组织都会花时间建立数据备份和恢复程序,来作为其整体运营的一部分,但很少有人会将长期数字保存视为数据保护规划的一部分。随着数字信息量的不断扩大,并作为组织资产的唯一记录,建立一个正式的计划以确保随着时间的推移能持续保持对关键数据的访问变得越来越重要了。
数字保存(digital preservation)是让具有持续价值的数字信息保持可访问性和可用性的正式努力。它涉及到规划、资源配置、保存方法和技术的应用。这样做是为了确保不管媒体故障和技术变革带来的挑战如何,人们都能继续访问经过重新格式化和重新生成的数字内容。
一个可行的计划需要考虑到,静止和传输中的数字内容都可能被破坏,并且内容也会受到基础技术的影响,这些技术将变得过时,甚至导致文件无法读取和访问。
对数字内容执行备份和恢复并不能确保保存,尽管将保存集成到保护数字资产的组合策略中可能是重要的。作为CIO,你需要对此关注吗?好吧,这取决于你的组织对数字内容的要求。
你是否拥有数字知识产权,以及随着时间的推移,这些知识产权有望保持高度的完整性和可访问性么?你是否拥有“永久”保留期的数字内容?如果你对这些问题的回答是肯定的,那么你还需要考虑备份和恢复以及业务连续性之外的数据保存策略。
作为一种实践,数字保存还处于起步阶段,而且关注范围很窄。很少有企业应用程序服务于这一领域。在博物馆、图书馆、政府和教育机构中,信息技术与数字保存从业者之间普遍存在着鸿沟。今年在墨西哥城举行的年度保存和档案特别兴趣小组会议上,我提出了自己对数字保存的看法,以及建立一个保护环境的重要性,并且这一事实也得到了进一步的证实。在这次会议上,我发现许多数字保存从业者,但还没有信息技术专业的人员。
将数字保存作为一项业务任务
作为CIO,如果你有数字保存方面的实践,但你还没有参与其中,那就请参与进来吧。为什么?因为用于保存的数字内容可能会淹没你的可用存储空间和网络连接,并对可连续性和灾难恢复规划和测试产生深远影响。如果你没有保存的实践,但符合上面提到的一些标准,那么你就有了一项艰巨的任务要教育你的主管和董事会,让他们了解你的组织在现状下所面临的固有风险。如果不参与也可能导致因为长期的支持问题而带来“影子IT”。
有一些国际标准(ISO 16363和其他标准)涵盖了这一主题,但我发现简单和直接的标准之一是国家数字化管理联盟标准。该标准提供了一种简单的方法,可以将您的组织的数字保存成熟度定义为1到4级。要达到4级,从IT角度来看,你必须维护地理上和技术上不同分布的3份数字档案副本。你还应该维护一个不可见的副本,这个拷贝不是人类可以访问的,它会通过保存平台本身来保存数据。
地理隔离减轻了自然灾害、停电或人为灾难所带来的风险。技术分离则降低了单一的常见技术出现缺陷的风险。使用同一云提供商在三个不同的数据中心拥有三份拷贝就不符合这一要求。不可见副本降低了有意或无意删除整个归档的风险。这对体系结构来说也有重要的在IT安全方面的影响。必须将深层档案锁定在少数量的保存和支持人员手中,并对档案网络进行分段,以提供进一步的安全性。可用性和访问监控也非常重要。
结论和实践建议
希望我已经成功地为数字保存的基础提供了一个以IT为中心的小视角,尽管从企业和组织的角度来看还有更多的含义。以下是对那些可能正在考虑数字保存策略的人的一些建议:
•确定可能长期存在的数字内容的风险。
•教育你的主要利益相关者了解相关的风险。
•确定你的组织对数字保存的需求,以符合其对数据完整性和可访问性的总体任务。
•与IT、数字保存人员和主要利益相关者组成一个紧密集成的跨职能团队。
•建立适当的长期治理。这不是一个一次性的项目,而必须是一种长期可持续的既定做法。
•对当前和未来维护数字内容的实践进行更详细地评估。
•与内容创造者沟通数字保存的要求。你不仅需要一个数字保存平台,还需要一个集成的数字资产管理环境,以便在创建时能够捕获适当的元数据,从而满足深度归档的保存标准。
•建立资金来源,认识到这不是典型的ROI,而是对知识保存的投资。
•与该领域的专家合作。虽然该行业还相对年轻,但在数字保存方面也有着成熟的从业者和专家。