关于数据备份与数据恢复的策略
来源:Donews 更新时间:2012-04-13

数字信息推动着商业的发展的同时,也变得与人们的生活息息相关。如网上银行、数码相机、 Intranet 、客户资料等信息是人们工作、生活不可缺少的部分,人们对数据的重要性有了越来越重要的认识。


为了加强数据的安全性,各种不同的备份软件也就应运而生了,如 IBM 的 Tivoli 存储管理器( TSM ), Veritas 公司的 NetBackup , Legato 公司的 NetWorker , CA 的 ARCserve ,DST达思凯瑞的爱数备份软件等,软件不同,功能各异。从备份策略来讲,现在的备份可分为三种:完全备份、增量备份、差异备份、累加备份策略。


下面来讨论以下这几种备份方式:

完全备份就是拷贝给定计算机或文件系统上的所有文件,而不管它是否被改变。
增量备份就是只备份在上一次备份后增加、改动的部分数据。增量备份可分为多级,每一次增量都源自上一次备份后的改动部分。
差异备份就是只备份在上一次完全备份后有变化的部分数据。如果只存在两次备份,则增量备份和差异备份内容一样。
累加备份采用数据库的管理方式,记录累积每个时间点的变化,并把变化后的值备份到相应的数组中,这种备份方式可恢复到指点的时间点。
一般在使用过程中,这三种策略常结合使用,常用的方法有:完全备份、完全备份加增量备份、完全备份加差异备份、完全备份加累加备份。


完全备份会产生大量数据移动,选择每天完全备份的客户经常直接把磁带介质连接到每台计算机上(避免通过网络传输数据)。这样,由于人的干预(放置磁带或填充自动装载设备),磁带驱动器很少成为自动系统的一部分。其结果是较差的经济效益和较高的人力花费。


完全备份加增量备份源自完全备份,不过减少了数据移动,其思想是较少使用完全备份。比如说在周六晚上进行完全备份(此时对网络和系统的使用最小)。在其它 6 天(周日到周五)则进行增量备份。增量备份会问这样的问题:自昨天以来,哪些文件发生了变化?这些发生变化的文件将存储在当天的增量备份磁带上。


使用周日到周五的增量备份能保证只移动那些在最近 24 小时内改变了的文件,而不是所有文件。由于只有较少的数据移动和存储,增量备份减少了对磁带介质的需求。对客户来讲则可以在一个自动系统中应用更加集中的磁带库,以便允许多个客户机共享昂贵的资源。然而,当恢复数据时,困难产生了。


在完全 + 增量方法下,完整的恢复过程首先需要恢复上周六晚的完全备份。然后再覆盖自完全备份以来每天的增量备份。该过程最坏的情况是要设置 7 个磁带集(每天一个)。如果文件每天都改的话,需要恢复 7 次才能得到最新状态。
 
由于完全 + 增量方法中恢复很困难,后来有了完全 + 差异方法。差异成为备份过程考虑的问题。增量备份考虑:自昨天以来哪些文件改变了?而差异方法考虑:自完全备份以来哪些文件发生了变化?对于完全备份后立即的备份过程(本例中周六),因为完全备份就在昨天,所以这两个问题的答案是相同的。但到了周一,答案不一样了。增量方法会问:昨天以来哪些文件改变了?并备份 24 小时内改变了的文件。差异方法问:完全备份以来哪些文件改变了?然后备份 48 小时内改变了的文件。到了周二,差异备份方法备份 72 小时内改变了的文件。
尽管差异备份比增量备份移动和存储更多的数据,但恢复操作简单多了。在完全 + 差异方法下,完整的恢复操作首先恢复上周六晚的完全备份。然后,差异方法不是覆盖每个增量备份磁带,而是直接跳向最近的磁带,覆盖积累的改变。 
 
完全 + 差异备份
客户在完全备份、完全 + 增量备份和完全 + 差异备份间权衡。
许多客户在管理时都会混合和匹配这三种方法,试图得到期望的可重获性水平。