CN1752939A - 用于综合备份和恢复的方法和系统 - Google Patents

用于综合备份和恢复的方法和系统 Download PDF

Info

Publication number
CN1752939A
CN1752939A CNA2005101064020A CN200510106402A CN1752939A CN 1752939 A CN1752939 A CN 1752939A CN A2005101064020 A CNA2005101064020 A CN A2005101064020A CN 200510106402 A CN200510106402 A CN 200510106402A CN 1752939 A CN1752939 A CN 1752939A
Authority
CN
China
Prior art keywords
data
computer
backup
readable medium
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005101064020A
Other languages
English (en)
Other versions
CN1752939B (zh
Inventor
B·T·贝尔科威茨
C·V·英根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1752939A publication Critical patent/CN1752939A/zh
Application granted granted Critical
Publication of CN1752939B publication Critical patent/CN1752939B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/16Protection against loss of memory contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units

Abstract

一种用于备份和恢复数据的方法和系统。首先,执行全备份以创建全数据集。此后,可通过增量式或差分备份分别创建增量式或差分数据集。当需要新的全数据集时,不执行全备份,可组合先前的全数据集与随后的增量式或差分数据集以创建新的全数据集。新的全数据集可在与提供先前全数据集的数据的计算机不同的计算机上创建。该新的全数据集可用于场外存储或可用于在计算机文件系统的故障或破坏情形中快速恢复数据。

Description

用于综合备份和恢复的方法和系统
技术领域
本发明一般涉及计算机,尤其涉及数据的备份和恢复。
背景技术
执行计算机上的全部数据备份是非常昂贵的管理任务。通常,它涉及枚举计算机的文件系统上的所有文件,并分开备份每一个这些文件。因为这些文件在文件系统上散布的随机性质以及提取与这些文件相关联的元数据施加的大量额外开销,在执行备份的过程中枚举所有文件会非常缓慢。不考虑费用,大多数机构在每周基础上执行全备份,既限制要从灾难中恢复所花的时间,又因为该需要将通过这些备份创建的数据集存储在场外以防数据中心丢失(例如火灾、洪灾、以及地震)。
增量式或差分备份可在各全备份之间执行,以捕捉各全备份之间发生的变化。由增量式或差分备份创建的数据集可在存储全备份时间和差分备份时间上文件系统之间的差异时消耗相当多的资源。有了增量式备份,灾难后在计算机上恢复文件可消耗比恢复由全备份创建的数据集并应用由一个或多个增量备份创建的数据集所需的多得多的时间。
所需要的是一种快速并有效地使文件系统能全部备份而不会严重影响计算机的性能的方法和系统。理想地,这样的方法和系统还将提供一种用于在计算机文件系统的部分或全部故障情形下将文件恢复到计算机的有效机制。
发明内容
简言之,本发明提供一种用于备份并恢复数据的方法和系统。首先,执行全备份以创建全数据集。然后,可通过增量式或差分备份分别创建增量式或差分数据集。当需要新的全部数据集时,不执行全备份,先前的全数据集可与随后的增量或差分数据集组合以创建新的全数据集。该新的全数据集可在与提供先前全数据集的数据的计算机不同的计算机上创建。该新的全数据集可用于场外存储或在计算机文件系统的故障或破坏情形快速恢复数据。
在本发明的一方面中,数据集被存储在诸如硬盘的在线存储器中。
在本发明的另一方面中,执行物理备份,这允许卷上所包含的影子副本也被备份。
在本发明的另一方面中,数据集可使用差分压缩创建以使多个数据集能有效存储于在线存储器中。
在本发明的又一方面中,文件系统过滤器跟踪文件系统中的某些文件(例如大文件)的哪些块或区域已经改变。在备份之后,不复制每个大文件,只复制已改变的块或区域。
在本发明的再一方面中,来自数据集的数据可由应用程序从数据集中直接读取以允许在恢复数据集之前或不恢复该数据集而访问数据。
参阅附图,其它优点将从以下详细描述中变得显而易见。
附图说明
图1是示出本发明可结合于其中的计算机系统的框图;
图2-4是一般示出根据本发明各方面可进行动作以执行综合性全备份的流程图;
图5是根据本发明各方面使用写复制(copy-on-write)的影子副本(shadowcopy)机制的各方面的框图;
图6是一般示出根据本发明各方面可执行物理备份的各动作的流程图;
图7是示出可根据本发明各方面跟踪已经改变盘区的示例性系统的框图;
具体实施方式
示例性操作环境
图1示出了本发明可在其上实现的适当的计算系统环境100的示例。该计算系统环境100仅是适当计算环境的一个示例,并非旨在提出对本发明使用或功能性范围作任何限制。计算环境100也不应被解释为对示例性操作环境100中所示的任一组件或其组合有任何依赖性或任何需求。
本发明也可在很多其它通用或专用计算系统环境或配置中使用。适于本发明使用的众所周知的计算系统、环境、和/或配置的示例包括,但不限于,个人计算机、服务器计算机、手持式或膝上型装置、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电器、网络PC、小型计算机、大型计算机、包括任一种以上系统或设备的分布式计算环境等等。
本发明可以计算机可执行指令的一般上下文进行说明,诸如由计算机执行的程序模块。一般而言,程序模块包括执行具体任务或实现具体抽象数据结构的例程、程序、对象、组件、数据结构等等。本发明还可在任务由经通信网络连接的远程处理设备执行的分布式计算环境中实践。在分布式计算环境中,程序模块可置于包括存储器存储设备的本地和远程计算机存储介质中。
参照图1,实现本发明的示例性系统包括以计算机110形式的通用计算设备。计算机110的组件可包括,但不限于,处理单元120、系统存储器130以及把包括系统存储器在内的各种系统组件耦合到处理单元120的系统总线121。系统总线121可能是若干总线结构类型中的任何一种,包括存储器总线或存储器控制器、外围总线、以及使用多种总线架构的任一种的本地总线。作为示例,而非限制,这些架构包括工业标准架构(ISA)总线、微信道架构(MCA)总线、扩展ISA(EISA)总线、视频电子标准协会(VESA)局部总线和也称为Mezzanine总线的外围部件互连(PCI)总线。
计算机110通常包括各种计算机可读介质。计算机可读介质可以是能被计算机110访问的任何可用介质,并包括易失性和非易失性介质、可移动和不可移动介质。作为示例,而非限制,计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质包括以任何方法或技术实现、用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的易失性和非易失性介质、可移动和不可移动介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字化多功能光盘(DVD)或其它光学存储技术、磁卡、磁带、磁盘存储或其它磁性存储设备、或任何其它可用于存储所需信息并可由计算机110访问的介质。通信介质通常在诸如载波或其它传输机制的调制数据信号中体现计算机可读指令、数据结构、程序模块、或其它数据,且包括任何信息输送介质。术语“调制数据信号”意指在信号中用对信息编码方式设置或改变其一个或多个特征的信号。作为示例,而非限制,通信介质包括诸如有线网络或直线连接的有线介质,和诸如声学、射频、红外线和其它无线介质的无线介质。以上任何介质的组合也应包括在计算机可读介质的范围中。
系统存储器130包括诸如只读存储器(ROM)131和随机存取存储器(RAM)132的易失性和/或非易失性存储器形式的计算机可读介质。包含有助于计算机110如起动时在元件间传送信息的基本例程的基本输入/输出系统(BIOS)133通常存储在ROM 131中。RAM 132通常包含可被处理单元120立即访问和/或当时正被操作的数据和/或程序模块。作为示例,而非限制,图1示出了操作系统134、应用程序135、其它程序模块136、和程序数据137。
计算机110还可包括其它可移动/不可移动、易失性/非易失性计算机存储介质。作为示例,图1图示了读取和写入不可移动、非易失性磁性介质的硬盘驱动器141,读取和写入可移动、非易失性磁盘152的磁盘驱动器151,读取和写入可移动、非易失性光盘156,诸如CD-ROM或其它光学介质的光盘驱动器155。其它也用在示例性计算环境中的可移动/不可移动、易失性/非易失性计算机存储介质包括,但不限于,如磁带、闪存卡、数字化视频光盘、数字化录像带、固态RAM、固态ROM等等。硬盘驱动器141通常通过诸如接口140的不可移动存储器接口与系统总线121连接,而磁盘驱动器151和光盘驱动器155通常通过诸如接口150的可移动存储器接口与系统总线121连接。
如上所述并如图1所示的盘驱动器及其相关联的计算机存储介质为计算机110提供计算机可读指令、数据结构、程序模块、和其它数据的存储。在图1中,例如,硬盘驱动器141被示为存储操作系统144、应用程序145、其它程序模块146、和程序数据147。注意这些组件可以与操作系统134、应用程序135、其它程序模块136、和程序数据137相同或不同。在此给予操作系统144、应用程序145、其它程序模块146、和程序数据147的数字不同至少说明他们是不同的副本。用户可通过输入装置如键盘162、和通常称为鼠标、跟踪球或触摸板等定位装置161向计算机110输入命令和信息。其它输入装置(未示出)可包括话筒、游戏杆、游戏垫、卫星接收器、扫描仪、手持式PC的触摸感应屏或其它书写板等等。这些和其它输入设备常常通过与系统总线耦合的用户输入接口160与处理单元120相连,但也可通过诸如并行端口、游戏端口或通用串行总线(USB)的其它接口连接。监视器191或其它类型的显示设备也可通过诸如视频接口190的接口与系统总线121相连。除了监视器,计算机还可包括诸如扬声器197和打印机196的其它输出设备,它们通过输出外围接口190相连。
计算机110可以在使用与一台或多台远程计算机,诸如远程计算机180的逻辑连接的网络化环境中运行。远程计算机180可以是个人计算机、服务器、路由器、网络PC、对等装置或其它公共网络节点,而且通常包括上述与个人计算机110相关的许多或全部组件,尽管在图1中仅图示了存储器存储设备181。图1中所描绘的逻辑连接包括局域网(LAN)171和广域网(WAN)173,但也可包括其它网络。这样的网络化环境在办公室、企业范围计算机网络、内联网和因特网上是常见的。
当用于LAN网络化环境中时,计算机110通过网络接口或适配器170与局域网171连接。当用于WAN网络化环境中时,计算机110通常包括调制解调器172或其它用于在广域网173,诸如因特网中建立通信的装置。可以是内置式或外置式的调制解调器172与系统总线121通过用户输入接口160或其它适当机制连接。在网络化环境中,与计算机110相关的程序模块或其一部分可存储在远程存储器存储装置中。作为示例,而非限制,图1示出了驻留于存储器装置181上的远程应用程序185。应当理解,所示网络连接是示例性的,且其它用于在计算机间建立通信连接的技术也可以使用。
综合性全备份
除了在周期性基础上执行全备份之外,全备份可用以后执行的增量式或差分备份来执行一次。在需要新的全数据集的任何时候(例如对场外存储为每周一次),综合性的全备份可使用最近的全数据集以及最近的差分数据集或最近全数据集之后创建的所有增量式数据集来进行。综合性全数据集创建一数据集,该数据集等同于正常全备份如果在综合性全备份使用的最近数据集的创建时间执行将创建的数据集。此后,术语全备份可指正常的全备份和/或综合性的全备份。
术语全数据集指在一时间点上数据源的数据的表示。数据源可包括卷(例如用于面向文件的数据)、数据库(例如用于存储在复杂存储器中的数据)、或其某些组合。全数据集可通过执行正常的全备份、综合性全备份、或物理全备份来创建。
差分数据集由差分备份创建,并包括最后全备份时的数据源和执行差分备份时的数据源之间的差异。增量式数据集由增量式备份创建,并包括最后备份(全、差分、或增量式)时的数据源和执行增量式备份时的数据源之间的差异。
以下描述了一种将由全备份和差分备份创建的数据集组合成综合性全备份的算法。该算法假设每个数据集都以微软带格式(Tape Format)(MTF)格式化,该方法也可应用于以任何格式格式化的数据集,其中有枚举数据集内容或至少与先前的全、差分或增量式数据集的增量Δ的现存或可创建的目录。
在由全、增量式、或差分备份以MTF格式创建的每个数据集中,卷上每个文件或目录的条目都显现在数据集的标头中。此后,术语“对象”有时用于指文件或目录、或两者。对于由全备份以MTF格式创建的全数据集,卷上所有文件和目录的元数据和数据出现在该全数据集中。对于由差分或增量式备份以MTF格式创建的数据集,如果对象是新创建的或已从差分或增量式数据集所基于的先前数据集改变,则条目的元数据和数据可仅出现在由差分或增量式备份创建的数据集中。MTF以明确定义的顺序来排序数据集内的对象,并确保如果对象F出现在该数据集中,则该对象的直到该卷的根的所有祖先目录(父、祖等)都已经先在该数据集内中显现。
当在此使用时,与对象相关联的数据包括与该对象相关联的内容,而与对象相关联的元数据包括与该对象相关联的任何属性或其它数据。
图2-4是一般示出根据本发明各方面可进行动作以执行综合性全备份的各个动作的流程图。参照图2,在框205,过程开始。在框210,创建一个新的空数据集。在框215,指针被设置成指向组合中所包括的每个数据集中第一个条目。设B0是指向最新差分或增量式数据集的指针,B1-BN-1是指向按时间排序且依次早于B0所指数据集的差分或增量式数据集的指针,而BN是指向最近的全数据集的指针。算法如下进行:
在框215,与每个数据集相关联的指针被分配到与该数据集相关联的第一个条目。在框220,如果必要,每个指针前进直到与该指针相关联的条目等于或大于B0所指的条目,如下结合图3进行更详细描述。如果指针所指条目已大于或大于B0所指条目,或者如果指针已过其关联数据集的最后一个条目,则指针无需再前进。
在框225,包括元数据和数据的来自第一数据集的信息被添加到新的数据集中,如下结合图4进行更详细描述。在框230,指针B0前进以检查在数据集中发现的下一条目。在框235,如果B0指示已达数据集之末,则处理在框240结束;否则,处理分支到框220。
图3是一般示出根据本发明各方面对应于图2框220的可进行以使指向数据集的指针前进的各个动作的流程图。指向每个数据集的指针(不包括与B0相关联的指针)前进(如果必要),直到它们大于或等于B0所指的条目。该过程在框305进入。在框310,索引(例如X)被分配为1以准备用于选择指针B1。在框315,选择指针BX以检查由指针BX所指的条目。在框320,确定由BX所指的数据集中的条目是否大于或等于由B0所指条目,或者BX是否已过了与BX相关联的数据集的末端。如果是,处理分支到框330,其中索引增加以获得下一指针。否则,处理分支到框325,其中指针BX增加以指向其相关联数据集的下一个条目。与框320和325相关联的循环继续直到BX所指条目大于或等于B0所指条目,或者BX指针已过与BX相关联的数据集的末端。
在框335,确定索引(例如X)是否大于指针的数量(例如N)。如果是,则在必要时所有指针已检查并前进,且处理分支到框340,其中过程返回到调用过程。如果不是,处理分支到框315,其中选择下一指针。
图4是一般示出根据本发明各方面的对应于图2的框225的可进行以找到要插入新数据集的最近数据集条目的动作的流程图。过程在框405进入。在框410,索引(例如X)被设置为零,以准备选择指向由最近备份创建的数据集的指针。在框415,选择指针BX以检查指针所指的条目。在框420,确定指针BX所指条目是否包含该条目的元数据和数据。如果BX所指条目包含元数据和数据,则处理分支到框430,其中该条目以及元数据和数据被添加到新的数据集中。否则,处理分支到框425,其中索引(例如X)在框425增加并在框415选择下一指针。由框415-425示出的动作重复,直到发现具有包含该数据和元数据的条目的最近数据集。
注意在MTF下,如果数据集包含对象的条目但不包含元数据或数据,这意味着每个先前的数据集都包含该对象的这种条目,直到某一数据集也包含该对象的数据和元数据为止。
上述算法可用来:
·组合全数据集和基于该全数据集的最近差分数据集;
·组合全数据集和在该全数据集后创建的每个增量式数据集(例如在仅执行增量式备份时使用);或者
·组合全数据集、基于该全数据集的最近差分数据集、以及基于该差分数据集的每个增量式数据集(例如在执行差分和增量式备份时使用)。
如上所述,所述算法已基于MTF格式进行了描述。然而,可以理解,不背离本发明的精神或范围,只要每个增量式或差分数据集包括确定哪些对象从先前数据集中删除以及哪些对象更改或添加到先前的数据集中的方法,本算法可简便地更改以考虑其它格式。
尽管上述算法可用来组合在盘上或磁带上的数据集,但实际上当正被组合的所有的增量式/差分数据集以及全数据集都在盘上时该算法最为有效。
此外,所述算法可归纳为多次组合,但与多次相关联的额外开支可使该算法实际上不那么令人感兴趣。因为磁带是时序介质,使所有数据集同时打开可使用适度的大量的磁带驱动器(例如每个数据集一个驱动器),并在无数据集并置时(即每个介质一个且只有一个组合数据集)可工作得最好。
最后,要从生产计算机中卸载组合处理,可使用独立的备份计算机来执行该组合处理。可以理解,这具有很多优点,包括解放用于生产目的的生产计算机。
物理备份和恢复
用于执行全备份的现有技术的一个问题是在备份的逻辑对象和这些对象在盘上的物理表示之间没有关联。该问题可通过使用影子副本来克服。影子副本是一个卷的“快照”。在逻辑上,影子副本是卷在给定时间点的准确副本,即使在创建该影子副本时该卷并未完全被复制(例如通过写复制)。影子副本可被操作系统和任何执行应用程序视为独立的卷。例如,影子副本可具有卷装置、卷名、驱动器字母、固定点、以及实际卷的任何其它属性。此外,影子副本可通过诸如与其相关联的网络共享(有时简称为“共享”)的网络远程路径展现,该网络共享允许从网络访问包含在影子副本内的备份或全部数据。
影子副本可通过各种众所周知的技术来创建,包括写复制、拆分镜像、创建盘本身的副本的专用硬件、以及其它本领域技术人员众所周知的方法和系统。
影子副本技术可使用差分区域来实现写复制影子副本。该差分区域将卷上的块映射到创建该影子副本的时间点上那些块的内容。影子副本技术的差分技术可在物理块层而不在对象(文件或目录)层上操作。
例如,参照图5,在写复制中,驱动器可把盘分成各个盘区。盘区指存储介质上的众多连续块,并可依赖于应用程序而不同。例如一个应用程序可将盘分成具有一个尺寸的盘区,而另一个应用程序则可将该盘分成具有不同尺寸的盘区。
如果盘上的块在创建影子副本之后改变,则在该块改变之前,包含该块的盘区(例如盘区506)被复制到差分区域515中的存储位置(例如盘区507)。对于一特定影子副本,盘区仅在盘区内任一块改变的第一次复制。当接收到对影子副本中信息的请求时,首先执行检查以确定该块是否在原始卷中就已改变(例如通过检查包含该块的盘区是否存在于差分区域515中)。如果该块尚未改变,则检索并返回来自原始卷中的数据。如果该块已经改变,则检索并返回来自差分区域515中的数据。注意如果用相同的数据来重写块,包含该块的盘区不写入差分区域515。
为了备份影子副本,保留从原始卷物理块到差分区域盘区的映射。一种备份卷和保持在其上的任何影子副本的方法是进行该卷的物理备份。术语物理备份指复制与卷相关联的物理块而不是执行逐个对象的备份。注意空盘区中的各个块可(或可以不)在物理备份中复制。备份应用程序可在通过备份创建的数据集中保存哪些盘区为空和哪些盘区不为空的位图或其它指示。可以理解,不复制空的盘区一般将使通过物理备份创建的数据集较小。
尽管本发明各方面已结合写复制影子副本技术进行了描述,也可使用其它影子副本技术而不背离本发明的精神或范围。
图6是一般示出根据本发明各方面可进行以执行物理备份的各动作的流程图。在用于持久影子副本的差分区域与原始卷共置的任何时候,执行物理备份将保留影子副本以及卷。在此情形中,可进行如下备份:
在框605,开始该过程。在框610,创建备份中所涉及的卷的备份影子副本。该备份影子副本可在备份一完成时就删除。注意,可进行创建该备份影子副本(而不是尝试复制直接来自该卷的各个块)以获取该卷的一致和稳定的映像。
在框615,影子副本打开作为原始卷,即作为表示作为影子副本的基础的物理块的文件。
在框620,影子副本按块的顺序进行备份。
在用于持久影子副本的差分区域不与原始卷并置的任何时候,包含差分区域的卷和原始卷一起进行备份。这可通过同时取两个卷的影子副本,然后访问影子副本以创建数据集来完成。用于取这种影子副本的示例性方法和系统在专利号为6,647,473的美国专利中描述,该专利受让给本发明的受让人,并在此引入作为参考。
物理备份具有某些重要特性:
·该备份大多数将按照对盘的螺旋读取(spiral read)来进行。对影子副本在上述框610创建之后改变的块可存在某些随机访问,但一般而言该备份将比可能的正常全备份快得多。
·该备份不会导致与获取关联对象和元数据相关联的先前讨论的文件处理额外开支。因而,该备份可使用比正在备份的计算机少得多的处理。
·当恢复由物理备份创建的数据集时,所恢复的卷将具有执行卷的影子副本时(例如在框610)该卷的内容以及那时在该卷上的所有持久影子副本。
由物理备份创建的数据集还可结合包括差分和/或增量式备份的正常备份循环用于快速恢复。由物理备份创建的数据集可视为全数据集,而由差分或增量式备份创建的数据集可指由物理备份创建的数据集。在此情形中,可通过首先恢复由物理备份创建的数据集,然后应用任何随后的差分和增量式数据集,来恢复随后的增量式或差分数据集。
此外,可任选的影子副本可在应用每个差分或增量式数据集后创建。创建这些可任选的影子副本可允许快速回复到任一影子副本所表示的盘状态中,从而可将卷恢复到卷灾难损失或破坏之前在该卷上有尽可能多的数据可用的状态。
还注意到,当全数据集由物理全备份创建时,恢复速度可比恢复通过非物理备份创建的数据集快得多,因为该恢复是通过各块的螺旋写入(spiral write)而不是逐个对象地完成的。
全数据集的差分压缩
通常,数据源从一周到另一周并不会有重大改变。此外,还有某些类型的期望仅有极小改变发生的数据源。这些数据源包括:
·与操作系统(OS)相关联的数据源,包括OS二元和系统服务持续状态。
·包括大多数只读数据库或文件存储器的数据源,诸如用于组合调度和文档管理系统的数据源,其中备份预约、联系人、以及文档管理数据库。这些数据源在文档更改或某些对象(例如联系人、日程表、以及时间表)改变时改变。
由于在线维护全数据集的成本相对较贵(即备份的卷的大小的数量级),能够压缩全数据集以利用其缓慢改变特性是有利的,并可允许使用相同的存储量在线维护多得多的全数据集。
两种技术可用于在备份中进行差分压缩:
·使用影子副本技术来进行压缩,如下进行更详细描述。该技术对块上内容的改变一般保持在同一地方且并不四处移动的数据集的作用很好。
·使用差分压缩算法,它能够确定相同数据在不同时间出现在不同位置的数据集中的差异。示例性差分压缩算法在序列号为10/825,753和10/844,893的美国专利申请中描述,这两个专利都受让给了本发明的受让人,并在此引入作为参考。
在一实施例中,使用影子副本技术,可如下执行新的全备份:
1.创建包含数据集的卷的持久影子副本。
2.用新的全数据集或新的综合性全数据集来重写原始卷上的原始数据集,如结合图2-4所述。
3.将原始数据集重命名为新的数据集。
在另一实施例中,可如下执行新的全备份:
1.创建包含数据集的卷的持久影子副本。
2.在与包含原始卷的卷不同的卷上,创建新的全数据集或新的综合性全数据集,如结合图2-4所述。
3.用该新的数据集重写原始数据集。
4.将原始数据集重命名为新的数据集。
5.在另一卷上删除该新的数据集。
当用新的数据集重写原始数据集时,上述影子副本技术将包含内容已经改变的块的盘区(在原始和新的数据集之间)置入差分区域。将名字从原始数据集名字改成新的数据集名字导致包含具有有关原始数据集的元数据的各个块的盘区改变并置入差分区域。这使得程序能访问新的数据集或原始的数据集(通过影子副本)。可以理解,通过使用上述技术,新的全数据集所需的额外盘空间可仅包括上个全数据集和新的全数据集之间改变的盘区。
新的备份可使用如下的远程差分压缩来执行:
1.创建新的综合性全数据集,如结合图2-4所述。
2.将所述示例性远程压缩算法之一应用于原始的全数据集和在步骤1创建的综合性全数据集中,以创建差分压缩的数据集。
3.删除新的数据集,并将差分压缩文件重命名为新的数据集名字。
在使用远程差分压缩创建差分压缩的数据集之后,可通过将差分压缩文件应用于先前的全数据集来获取全数据集。
大数据文件备份的增量(Δ)计算
通过检查存储装置上的每个对象以查看从差分或增量式备份所基于的上次备份起是否对象已改变,可执行差分或增量式备份。例如,通过查看对象的上次更改时间,可执行对象是否已改变的确定。如果确定该对象已改变,则整个对象可被复制到数据集中。对诸如数据库和电子邮件存储器等改变频繁但仅有小部分真正改变的大对象而言,每当对象的任一部分改变时就将整个对象复制到增量式或差分数据集,这可能消耗相当多的资源。
在本发明一实施例中,跟踪对象中自上次备份起真正改变的盘区,从而当执行增量式或差分备份时可对它们进行备份。跟踪这些盘区可用文件系统过滤器来完成,该过滤器跟踪计算机卷上大文件(例如大于16MB的任何文件)的改变。由文件系统过滤器跟踪的文件大小可预先配置或选择。
文件系统可在与卷相关联的持久存储器中保持以下信息:
·到已改变的对象的路径。
·已改变的对象中盘区的集。
在本发明一实施例中,文件系统过滤器跟踪对象中已改变的块的集,而不是已改变的内容的集。
图7是示出根据本发明各方面可跟踪已改变盘区的示例性系统的框图。操作系统705可接收对写入文件系统715的请求。这种请求可通过文件系统过滤器710传递。如果文件系统过滤器710确定应跟踪对文件盘区的任何改变,则它将已改变的盘区存储在持久存储器720中。
使用增量式备份方案,跟踪各盘区的持久存储器可在每当执行增量式或全备份时复位,从而可跟踪从每个先前备份的变化。如果使用差分备份方案,则跟踪盘区的持久存储器可在每当执行新的全备份时复位。
差分或增量式备份可如下使用持久存储器。如果对对象的引用显现在持久存储器中,则差分或增量式备份可简单地备份:
已改变对象中的盘区列表;以及
按显现在列表中的相同顺序的那些盘区的内容。
为了从一组增量式数据集或全数据集中,或从差分数据集和全数据集中重建一对象,可执行以下动作:
1.对于该对象中的每个盘区,找到具有已改变盘区的列表中的盘区或具有该对象的全数据集的最近数据集;以及
2.从该数据集复制该盘区并继续下一盘区。
在本发明一实施例中,可维护两个盘区列表以支持全、差分、以及增量式备份方案。该文件系统过滤器通过以下动作来跟踪在该两个列表中是否每个(例如足够大的大小或其它标准的)候选对象都已改变:
·维护自执行上一次全备份起那些对象中已改变的盘区的列表;以及
·维护自执行上一次差分或增量式备份起那些对象中已改变的盘区的列表。
差分数据集可使用第一个盘区列表来创建,而增量式数据集可使用第二个盘区列表来创建。该第二个列表可在任何时候执行增量式或差分备份时复位。第一个列表可在执行全备份时复位。
从数据集中直接读取数据
许多应用程序(例如电子邮件、文档管理、活动目录等)将对象存储在数据库中。常常需要从数据库恢复特定对象集,而不是恢复整个数据库。常常是从用户出错中恢复的情形,诸如当用户意外地删除了不想删除的文档或电子邮件时。例如,从电子邮件数据库恢复邮件箱以及从文档管理系统中恢复单个文档是非常常见的。
通常,这些类型的对象通过以下来恢复:为整个数据库分配空间、将整个数据库恢复为要恢复的对象处在所需状态(例如未删除或改变)的时间点、然后使用应用程序(例如电子邮件系统、文档管理系统、或其它适当应用程序)来安装数据库并提取所需对象。
通过将数据集保留在盘上,可能不需要在通过适当应用程序访问所需对象之前将该数据集恢复到盘上。相反,应用程序可直接访问存储在该数据集中的各个文件。如果通过物理备份创建的数据集被存储为卷的副本(与TMF格式相反),则在移除数据集中的任何首部或尾部之后该数据集可直接安装为卷。
如果数据集以MTF格式(或某些其它存档格式)进行存储,则文件系统过滤器可执行以下动作:
·将数据集展现为卷,并允许访问该卷。给予该卷不同的名字,并允许通过在本地计算机名字空间中与原始卷位置不同的位置进行访问;
·执行一查寻,以在应用程序通过展现的卷尝试打开数据库文件时定位包含在数据集中的适当数据库文件。注意,当数据集显现为卷时(例如通过使用文件系统过滤器),该卷中每个文件和目录(以及因此该数据集)可直接打开;
·使元数据能够从卷中直接读取,并使对象数据能使用正常的文件系统I/O原语来读取;以及
·通过在应用程序尝试将数据写入卷时在一独立位置执行写复制,来保留数据集的只读特性。这对支持诸如电子邮件服务器或客户机的不支持只读安装的应用程序来说是有用的。
文件系统过滤器可利用与数据集相关联的在线目录,该目录将数据集中的每个对象映射到所创建的卷中的相应偏移。该目录可为其中不存储目录的数据集创建。例如,当在卷中打开一对象时,可在该在线目录中搜索该对象以及发现的在该数据集中的偏移。
偏移处的首部可用来提取该对象的元数据,并创建对象的偏移和对象数据中的偏移之间的映射。对该对象的任何读取操作可导致对该数据集在所计算偏移上基于该映射的相应读取操作。
对于以MTF或非MTF格式存储的数据集,如果数据集通过增量式或差分备份创建,则文件系统过滤器可视该数据集及其所基于的任何其它数据集为单元。为了获取与对象相关的信息,可搜索数据集单元以找到包含该信息的最近数据集。在允许访问基于由备份创建的数据集组合的卷之前,可创建在线目录,以将对象映射到数据集内的相应位置。
从前面的详细描述中可见,提供了一种用于创建、恢复、并使用与备份相关联的数据集的经改进方法和系统。尽管本发明易于进行各种更改和可选构建,但仅有其中某些说明性实施例在附图中示出,并如上进行了详细描述。然而,可以理解,并非旨在将本发明限制在所揭示的特定形式中,而是相反旨在包括落于本发明精神和范围之内的所有更改、可选构建、或等效方案。

Claims (37)

1.一种具有计算机可执行指令的计算机可读介质,其特征在于,包括:
执行文件系统的第一次全备份以创建第一全数据集,所述文件系统包括数据;
执行随后的备份以创建第二数据集,所述第二数据集包括所述文件系统的数据的一部分;以及
组合所述第一全数据集和所述第二数据集以创建所述文件系统的第二全数据集。
2.如权利要求1所述的计算机可读介质,其特征在于,执行所述第一全备份包括将所述数据在线复制到在线存储器中。
3.如权利要求1所述的计算机可读介质,其特征在于,所述在线存储器包括硬盘。
4.如权利要求2所述的计算机可读介质,其特征在于,所述数据包括每个都与元数据相关联的对象,且其中通过获取与每个对象相关联的元数据,并将所述对象及其相关联元数据复制到所述在线存储器,将所述数据复制到在线存储器中。
5.如权利要求2所述的计算机可读介质,其特征在于,所述文件系统包括一盘卷,且其中将所述数据复制到所述在线存储器包括创建盘卷的影子副本并将所述影子副本复制到所述在线存储器中。
6.如权利要求5所述的计算机可读介质,其特征在于,所述影子副本保持在所述盘卷中。
7.如权利要求5所述的计算机可读介质,其特征在于,所述影子副本保持在所述盘卷和另一盘卷中。
8.如权利要求1所述的计算机可读介质,其特征在于,所述文件系统包括具有影子副本的盘卷,且其中与所述影子副本相关联的数据在每个备份期间保持。
9.如权利要求8所述的计算机可读介质,其特征在于,与所述影子副本相关联的数据通过在执行每个备份时复制所述盘卷的物理块时得到保持。
10.如权利要求8所述的计算机可读介质,其特征在于,还包括恢复所述第二全数据集以及与保持其中的所述影子副本相关联的所述数据,从而所述影子副本可正常访问。
11.如权利要求1所述的计算机可读介质,其特征在于,所述数据存储在分成多个块的存储器中,且其中所述第一次备份和所述随后备份通过所述存储器的物理备份来执行。
12.如权利要求11所述的计算机可读介质,其特征在于,所述物理备份通过打开包括要备份的所有块的文件,并复制要备份的块来执行。
13.如权利要求11所述的计算机可读介质,其特征在于,还包括通过包括打开作为文件的所述第一个全数据集,然后将所述第一个全数据集中的各个块顺序复制到恢复存储器的物理恢复,来恢复所述第一个全数据集。
14.如权利要求13所述的计算机可读介质,其特征在于,还包括将包括在所述第二个数据集中的文件系统的数据的一部分应用于所述恢复存储器。
15.如权利要求1所述的计算机可读介质,其特征在于,所述数据包括块,且其中执行所述随后备份包括压缩所述数据的一部分。
16.如权利要求15所述的计算机可读介质,其特征在于,压缩所述数据的一部分包括将所述数据中已改变的任何块置入差分区域。
17.如权利要求16所述的计算机可读介质,其特征在于,所述数据中已改变的块通过影子副本机制的操作而置入差分区域。
18.如权利要求17所述的计算机可读介质,其特征在于,多个全数据集在存储装置上呈现,作为通过所述影子副本机制创建的多个影子副本。
19.如权利要求15所述的计算机可读介质,其特征在于,压缩所述数据的一部分包括应用差分压缩算法。
20.如权利要求1所述的计算机可读介质,其特征在于,所述数据包括与文件系统上所包含的对象相关联的块,并且还包括跟踪包括自执行所述第一次全备份起改变的已改变对象块的已改变块或盘区。
21.如权利要求20所述的计算机可读介质,其特征在于,执行所述随后备份来创建第二个数据集包括通过仅复制包括改变块的已改变块或盘区来复制已经改变的对象。
22.如权利要求20所述的计算机可读介质,其特征在于,只跟踪超过某一尺寸的对象的块或盘区。
23.如权利要求20所述的计算机可读介质,其特征在于,执行所述随后备份来创建第二个数据集包括通过将与已改变但未跟踪的其它对象相关联的所有块复制到所述第二个数据集来复制所述其它对象。
24.一种计算环境中的方法,包括:
执行第一卷的备份以创建数据集,其中所述第一卷包括由应用程序通过一系列操作访问的数据;以及
由所述应用程序在恢复所述数据集之前或不恢复所述数据集,通过所述操作之一访问所述数据集中的数据。
25.如权利要求24所述的方法,其特征在于,与第一卷相比,所述应用程序不知道正在访问所述数据集中的数据。
26.如权利要求24所述的方法,其特征在于,所述应用程序访问所述数据集中的数据,就好像所述应用程序访问所述第一卷中的数据。
27.如权利要求24所述的方法,其特征在于,还包括将所述数据集安装为第二卷。
28.如权利要求24所述的方法,其特征在于,所述操作之一包括写操作。
29.如权利要求28所述的方法,其特征在于,还包括把通过所述写操作写入所述数据集的任何数据置于单独的位置。
30.一种计算环境中的系统,包括:
操作系统,被安排成接收对访问文件系统上所包含的对象的请求;
文件系统过滤器,被安排成确定是否跟踪对所述对象的改变;以及
持久存储器,被安排成跟踪对象的哪些块已改变。
31.如权利要求30所述的系统,其特征在于,所述请求包括对写入所述对象的请求。
32.如权利要求30所述的系统,其特征在于,所述对象被包括在要跟踪其改变的对象的列表中。
33.如权利要求30所述的系统,其特征在于,所述对象是一种尺寸,且其中确定是否跟踪对对象的改变包括确定所述对象的尺寸是否大于或等于阈值尺寸。
34.如权利要求30所述的系统,其特征在于,还包括一恢复应用程序,它被安排成通过执行以下动作来从一系列数据集中重建所述对象,所述动作包括:
对于所述对象中的每个块,
寻找具有已改变的块的列表中的块或具有所述对象的全数据集的数据集的最近数据集,以及
从所述最近数据集中复制所述块。
35.一种具有计算机可执行指令的计算机可读介质,其特征在于,包括:
创建并维护包括第一全数据集的卷的影子副本,其中所述影子副本是所述卷在一时间点上的逻辑复制;
创建所述卷的第二全数据集;
用所述第二全数据集来重写所述第一全数据集,同时维护所述影子副本;
删除所述第二全数据集;
将所述第一全数据集重命名为所述第二全数据集;以及
通过所述影子副本访问所述第一全数据集。
36.如权利要求35所述的计算机可读介质,其特征在于,还包括访问所述卷上的所述第二全数据集。
37.如权利要求35所述的计算机可读介质,其特征在于,所述第一和第二全数据集之间的差异保持在与所述影子副本相关联的差分区域中。
CN2005101064020A 2004-09-22 2005-09-22 用于综合备份和恢复的方法 Expired - Fee Related CN1752939B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/948,009 US7756833B2 (en) 2004-09-22 2004-09-22 Method and system for synthetic backup and restore
US10/948,009 2004-09-22

Publications (2)

Publication Number Publication Date
CN1752939A true CN1752939A (zh) 2006-03-29
CN1752939B CN1752939B (zh) 2011-06-22

Family

ID=35530774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005101064020A Expired - Fee Related CN1752939B (zh) 2004-09-22 2005-09-22 用于综合备份和恢复的方法

Country Status (9)

Country Link
US (2) US7756833B2 (zh)
EP (1) EP1640868B1 (zh)
JP (1) JP4807992B2 (zh)
KR (1) KR101153023B1 (zh)
CN (1) CN1752939B (zh)
AU (2) AU2005203663B2 (zh)
BR (1) BRPI0503703A (zh)
CA (1) CA2516102A1 (zh)
MX (1) MXPA05009680A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100449501C (zh) * 2006-09-21 2009-01-07 上海交通大学 计算机网络数据恢复的方法
CN100524238C (zh) * 2007-11-02 2009-08-05 西安三茗科技有限责任公司 基于块级的增量备份和整卷恢复的方法
CN102117209A (zh) * 2010-12-20 2011-07-06 深圳市科陆电子科技股份有限公司 一种web系统中对中间数据定时处理的方法
CN101853194B (zh) * 2009-04-03 2011-12-14 纬创资通股份有限公司 数据备份方法
CN102375700A (zh) * 2010-08-26 2012-03-14 湖北盛天网络技术有限公司 一种直接更新硬盘数据的方法
CN101449269B (zh) * 2006-05-10 2012-12-12 伊姆西公司 自动优先恢复
CN102959518A (zh) * 2009-12-22 2013-03-06 国际商业机器公司 使用多个同时装置流的完全系统备份和增量备份的恢复
CN103262043A (zh) * 2010-09-29 2013-08-21 赛门铁克公司 从差异备份中执行数据库的精细恢复的方法和系统
CN103793296A (zh) * 2014-01-07 2014-05-14 浪潮电子信息产业股份有限公司 一种在集群中用于辅助备份复制计算机系统的方法
CN103902336A (zh) * 2014-03-13 2014-07-02 深圳创维-Rgb电子有限公司 操作系统启动控制的方法及装置
CN105162869A (zh) * 2015-09-18 2015-12-16 久盈世纪(北京)科技有限公司 一种用于数据备份管理的方法与设备
CN105739913A (zh) * 2014-12-12 2016-07-06 华为技术有限公司 一种磁盘分区排布方法及装置
WO2016145838A1 (zh) * 2015-08-03 2016-09-22 中兴通讯股份有限公司 一种元数据管理方法及装置、分布式文件系统
CN106412200A (zh) * 2016-10-08 2017-02-15 四川秘无痕信息安全技术有限责任公司 一种提取wp系统联系人数据的方法
CN108509641A (zh) * 2018-04-11 2018-09-07 北京小米移动软件有限公司 文件备份的方法、装置、服务器以及系统
CN111367856A (zh) * 2020-02-28 2020-07-03 杭州宏杉科技股份有限公司 数据复制方法、装置、电子设备及机器可读存储介质
CN111581013A (zh) * 2020-03-18 2020-08-25 宁波送变电建设有限公司永耀科技分公司 基于元数据和影子文件的系统信息备份与重构方法

Families Citing this family (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7146476B2 (en) * 2003-08-05 2006-12-05 Sepaton, Inc. Emulated storage system
US8938595B2 (en) * 2003-08-05 2015-01-20 Sepaton, Inc. Emulated storage system
US20050108486A1 (en) * 2003-08-05 2005-05-19 Miklos Sandorfi Emulated storage system supporting instant volume restore
US20060047855A1 (en) * 2004-05-13 2006-03-02 Microsoft Corporation Efficient chunking algorithm
US20060059384A1 (en) * 2004-08-16 2006-03-16 Fabrice Helliker Full backup from incremental /differential backups
US7613787B2 (en) * 2004-09-24 2009-11-03 Microsoft Corporation Efficient algorithm for finding candidate objects for remote differential compression
US20070094348A1 (en) * 2005-01-07 2007-04-26 Microsoft Corporation BITS/RDC integration and BITS enhancements
US8073926B2 (en) * 2005-01-07 2011-12-06 Microsoft Corporation Virtual machine image server
US7849462B2 (en) * 2005-01-07 2010-12-07 Microsoft Corporation Image server
US7725438B1 (en) * 2005-01-31 2010-05-25 Veritas Operating Corporation Method and apparatus for efficiently creating backup files
US8201021B1 (en) 2005-01-31 2012-06-12 Symantec Corporation Method and apparatus for efficiently creating backup files with less redundancy
US8799206B2 (en) 2005-02-07 2014-08-05 Mimosa Systems, Inc. Dynamic bulk-to-brick transformation of data
US8812433B2 (en) 2005-02-07 2014-08-19 Mimosa Systems, Inc. Dynamic bulk-to-brick transformation of data
US8918366B2 (en) 2005-02-07 2014-12-23 Mimosa Systems, Inc. Synthetic full copies of data and dynamic bulk-to-brick transformation
US8271436B2 (en) * 2005-02-07 2012-09-18 Mimosa Systems, Inc. Retro-fitting synthetic full copies of data
US7672979B1 (en) * 2005-04-22 2010-03-02 Symantec Operating Corporation Backup and restore techniques using inconsistent state indicators
US7801859B1 (en) * 2005-05-25 2010-09-21 Emc Corporation Tracking filesystem backups
US9075819B1 (en) * 2005-06-30 2015-07-07 Symantec Operating Corporation Method and apparatus for providing parallel backup set processing for creating a synthetic backup
US7512756B2 (en) * 2005-09-06 2009-03-31 Reldata, Inc. Performance improvement for block span replication
US7496608B2 (en) * 2005-10-07 2009-02-24 International Business Machines Corporation Online system and method for restoring electronic media on electronic storage devices
US20070208918A1 (en) * 2006-03-01 2007-09-06 Kenneth Harbin Method and apparatus for providing virtual machine backup
US20070220026A1 (en) * 2006-03-17 2007-09-20 Microsoft Corporation Efficient caching for large scale distributed computations
US7613750B2 (en) * 2006-05-29 2009-11-03 Microsoft Corporation Creating frequent application-consistent backups efficiently
US7461223B2 (en) * 2006-05-29 2008-12-02 Microsoft Corporation Retaining shadow copy data during replication
WO2007138461A2 (en) * 2006-05-31 2007-12-06 Pankaj Anand Method and a system for obtaining differential backup
US8025650B2 (en) * 2006-06-12 2011-09-27 Wound Care Technologies, Inc. Negative pressure wound treatment device, and methods
US9015520B2 (en) 2006-06-29 2015-04-21 Dssdr, Llc Data transfer and recovery
US8990613B2 (en) 2006-06-29 2015-03-24 Dssdr, Llc Data transfer and recovery
US7487383B2 (en) 2006-06-29 2009-02-03 Dssdr, Llc Data transfer and recovery process
US7853567B2 (en) * 2006-08-04 2010-12-14 Apple Inc. Conflict resolution in recovery of electronic data
US7856424B2 (en) * 2006-08-04 2010-12-21 Apple Inc. User interface for backup management
US20080034004A1 (en) * 2006-08-04 2008-02-07 Pavel Cisler System for electronic backup
US8166415B2 (en) * 2006-08-04 2012-04-24 Apple Inc. User interface for backup management
US7853566B2 (en) 2006-08-04 2010-12-14 Apple Inc. Navigation of electronic backups
US20080034017A1 (en) * 2006-08-04 2008-02-07 Dominic Giampaolo Links to a common item in a data structure
US7809687B2 (en) * 2006-08-04 2010-10-05 Apple Inc. Searching a backup archive
US20080126442A1 (en) * 2006-08-04 2008-05-29 Pavel Cisler Architecture for back up and/or recovery of electronic data
US7809688B2 (en) * 2006-08-04 2010-10-05 Apple Inc. Managing backup of content
US9009115B2 (en) * 2006-08-04 2015-04-14 Apple Inc. Restoring electronic information
US8311988B2 (en) 2006-08-04 2012-11-13 Apple Inc. Consistent back up of electronic information
US8370853B2 (en) * 2006-08-04 2013-02-05 Apple Inc. Event notification management
US7860839B2 (en) * 2006-08-04 2010-12-28 Apple Inc. Application-based backup-restore of electronic information
US7941403B2 (en) * 2006-11-30 2011-05-10 Hewlett-Packard Development Company, L.P. Embedded file system recovery techniques
US8150810B1 (en) * 2006-12-21 2012-04-03 Symantec Corporation Method and apparatus for file sharing between continuous and scheduled backups
JP2008197894A (ja) * 2007-02-13 2008-08-28 Nec Corp データバックアップシステムおよびデータバックアップ方法ならびにプログラム
US7865473B2 (en) * 2007-04-02 2011-01-04 International Business Machines Corporation Generating and indicating incremental backup copies from virtual copies of a data set
US9633028B2 (en) * 2007-05-09 2017-04-25 Illinois Institute Of Technology Collaborative and personalized storage and search in hierarchical abstract data organization systems
US10042898B2 (en) 2007-05-09 2018-08-07 Illinois Institutre Of Technology Weighted metalabels for enhanced search in hierarchical abstract data organization systems
US8099392B2 (en) 2007-06-08 2012-01-17 Apple Inc. Electronic backup of applications
US8468136B2 (en) * 2007-06-08 2013-06-18 Apple Inc. Efficient data backup
US20080307017A1 (en) 2007-06-08 2008-12-11 Apple Inc. Searching and Restoring of Backups
US8010900B2 (en) 2007-06-08 2011-08-30 Apple Inc. User interface for electronic backup
US8725965B2 (en) 2007-06-08 2014-05-13 Apple Inc. System setup for electronic backup
EP2372553B1 (en) * 2007-06-08 2013-01-30 Apple Inc. Application-based backup-restore of electronic information
US8745523B2 (en) * 2007-06-08 2014-06-03 Apple Inc. Deletion in electronic backups
US8307004B2 (en) 2007-06-08 2012-11-06 Apple Inc. Manipulating electronic backups
US8429425B2 (en) * 2007-06-08 2013-04-23 Apple Inc. Electronic backup and restoration of encrypted data
JP4944686B2 (ja) * 2007-06-28 2012-06-06 ソニーモバイルコミュニケーションズ株式会社 ソフトウェア更新方法および携帯端末装置
US7877553B2 (en) 2007-08-06 2011-01-25 Microsoft Corporation Sharing volume data via shadow copies using differential areas
US7788234B2 (en) * 2007-08-23 2010-08-31 Microsoft Corporation Staged, lightweight backup system
US8447940B2 (en) 2008-05-02 2013-05-21 International Business Machines Corporation Backup copy enhancements to reduce primary version access
EP2283121B1 (en) 2008-05-16 2015-02-11 REG Life Sciences, LLC Methods and compositions for producing hydrocarbons
US8244681B2 (en) * 2008-06-09 2012-08-14 Symantec Operating Corporation Creating synthetic backup images on a remote computer system
US7831682B2 (en) * 2008-08-08 2010-11-09 Amazon Technologies, Inc. Providing a reliable backing store for block data storage
MX2011004286A (es) 2008-10-28 2011-06-01 Ls9 Inc Metodos y composiciones para producir alcoholes grasos.
US8060475B1 (en) * 2008-12-04 2011-11-15 Symantec Corporation Intelligent recovery point copying system and method
US8682862B2 (en) * 2009-04-10 2014-03-25 Phd Virtual Technologies Inc. Virtual machine file-level restoration
US8370306B1 (en) * 2009-11-13 2013-02-05 Symantec Corporation Systems and methods for recovering from continuous-data-protection blackouts
US8380678B2 (en) 2009-11-24 2013-02-19 Symantec Corporation Tracking files which have been processed by a backup or a restore operation
US9558075B2 (en) * 2009-11-24 2017-01-31 Veritas Technologies Llc Synthetic full backup generation
US8190574B2 (en) * 2010-03-02 2012-05-29 Storagecraft Technology Corporation Systems, methods, and computer-readable media for backup and restoration of computer information
US9158653B2 (en) 2010-03-21 2015-10-13 Hewlett-Packard Development Company, L.P. Determining impact of virtual storage backup jobs
WO2011119173A1 (en) * 2010-03-26 2011-09-29 Carbonite, Inc. Transfer of user data between logical data sites
US8495022B1 (en) * 2010-05-13 2013-07-23 Symantec Corporation Systems and methods for synthetic backups
KR101753313B1 (ko) 2010-07-08 2017-07-19 삼성전자주식회사 파일 백업 장치 및 방법
US8793217B2 (en) * 2010-07-16 2014-07-29 Ca, Inc. Block level incremental backup
WO2012030383A1 (en) 2010-08-31 2012-03-08 Falconstor, Inc. Data deduplication
US9009724B2 (en) 2010-09-24 2015-04-14 Hewlett-Packard Development Company, L.P. Load balancing data access in virtualized storage nodes
US10114847B2 (en) 2010-10-04 2018-10-30 Ca, Inc. Change capture prior to shutdown for later backup
US8682873B2 (en) 2010-12-01 2014-03-25 International Business Machines Corporation Efficient construction of synthetic backups within deduplication storage system
US9009430B2 (en) 2010-12-02 2015-04-14 International Business Machines Corporation Restoration of data from a backup storage volume
CN106407044B (zh) * 2010-12-14 2019-09-24 株式会社日立制作所 信息处理系统中的故障恢复方法和信息处理系统
US8635187B2 (en) 2011-01-07 2014-01-21 Symantec Corporation Method and system of performing incremental SQL server database backups
US8984029B2 (en) 2011-01-14 2015-03-17 Apple Inc. File system management
US8943026B2 (en) 2011-01-14 2015-01-27 Apple Inc. Visual representation of a local backup
US8866649B2 (en) * 2011-09-14 2014-10-21 Netapp, Inc. Method and system for using non-variable compression group size in partial cloning
US9026496B1 (en) * 2011-09-30 2015-05-05 Emc Corporation Efficient building of restore list
US8676757B2 (en) 2011-10-18 2014-03-18 Microsoft Corporation Application of a differential dataset to a data store using sequential change sets
US9098452B2 (en) 2011-12-19 2015-08-04 International Business Machines Corporation Selecting files to backup in a block level backup
JP5974620B2 (ja) * 2012-05-10 2016-08-23 富士通株式会社 バックアップ方法、プログラムおよびバックアップ装置
JP5911378B2 (ja) * 2012-05-31 2016-04-27 キヤノン株式会社 文書管理サーバ、コンピュータプログラム、文書管理方法
US8892941B2 (en) 2012-06-27 2014-11-18 International Business Machines Corporation Recovering a volume table and data sets from a corrupted volume
US9398092B1 (en) * 2012-09-25 2016-07-19 Emc Corporation Federated restore of cluster shared volumes
US8782005B2 (en) * 2012-12-12 2014-07-15 Storagecraft Technology Corporation Pruning previously-allocated free blocks from a synthetic backup
US9268647B1 (en) * 2012-12-30 2016-02-23 Emc Corporation Block based incremental backup from user mode
JP6064608B2 (ja) * 2013-01-17 2017-01-25 富士通株式会社 ストレージ装置、バックアッププログラム、およびバックアップ方法
US9483494B1 (en) * 2013-03-14 2016-11-01 Emc Corporation Opportunistic fragmentation repair
GB2514568A (en) * 2013-05-29 2014-12-03 Push Button Recovery Ltd System to control backup migration and recovery of data and method of protection
GB2514569A (en) * 2013-05-29 2014-12-03 Push Button Recovery Ltd System to control backup migration and recovery of data
US9086811B2 (en) 2013-07-17 2015-07-21 International Business Machines Corporation Managing data sets of a storage system
US10318386B1 (en) * 2014-02-10 2019-06-11 Veritas Technologies Llc Systems and methods for maintaining remote backups of reverse-incremental backup datasets
US10339010B1 (en) * 2014-04-05 2019-07-02 Bruce Talley Systems and methods for synchronization of backup copies
US9626367B1 (en) 2014-06-18 2017-04-18 Veritas Technologies Llc Managing a backup procedure
US9152507B1 (en) * 2014-09-05 2015-10-06 Storagecraft Technology Corporation Pruning unwanted file content from an image backup
US9697268B1 (en) * 2014-09-16 2017-07-04 Amazon Technologies, Inc. Bulk data distribution system
EP3213211A4 (en) 2014-10-29 2017-09-06 Hewlett-Packard Enterprise Development LP Data restoration using allocation maps
US9703644B1 (en) * 2014-12-09 2017-07-11 EMC IP Holding Company LLC Methods for generating a synthetic backup and for consolidating a chain of backups independent of endianness
CA2876468C (en) * 2014-12-29 2023-02-28 Ibm Canada Limited - Ibm Canada Limitee System and method for selective compression in a database backup operation
US10078555B1 (en) * 2015-04-14 2018-09-18 EMC IP Holding Company LLC Synthetic full backups for incremental file backups
US9996429B1 (en) 2015-04-14 2018-06-12 EMC IP Holding Company LLC Mountable container backups for files
US9946603B1 (en) 2015-04-14 2018-04-17 EMC IP Holding Company LLC Mountable container for incremental file backups
US20160364435A1 (en) * 2015-06-12 2016-12-15 Adi, Llc Generating a new synthetic dataset longitudinally consistent with a previous synthetic dataset
US9519432B1 (en) 2015-06-15 2016-12-13 International Business Machines Corporation Self-adjusting backup operations
US10802928B2 (en) 2015-09-10 2020-10-13 International Business Machines Corporation Backup and restoration of file system
KR101658741B1 (ko) * 2015-11-23 2016-09-21 (주)클로닉스 컴퓨터 시스템의 증분 백업과 차등 백업을 이용한 혼합 백업과 복원 장치 및 제어 방법
US11036394B2 (en) 2016-01-15 2021-06-15 Falconstor, Inc. Data deduplication cache comprising solid state drive storage and the like
US9619335B1 (en) 2016-03-11 2017-04-11 Storagecraft Technology Corporation Filtering a directory enumeration of a directory to exclude files with missing file content from an image backup
KR102084661B1 (ko) * 2016-07-06 2020-03-04 주식회사 케이티 디스크 관리 방법 및 이를 수행하는 컴퓨터 장치
US11747983B2 (en) * 2016-10-06 2023-09-05 Netflix, Inc. Techniques for generating snapshots of datasets
US10346062B2 (en) * 2016-11-16 2019-07-09 International Business Machines Corporation Point-in-time backups via a storage controller to an object storage cloud
US10389743B1 (en) 2016-12-22 2019-08-20 Symantec Corporation Tracking of software executables that come from untrusted locations
US11449389B2 (en) 2017-06-02 2022-09-20 Apple Inc. Techniques for performing incremental data backups
US11550665B2 (en) 2017-06-02 2023-01-10 Apple Inc. Techniques for preserving clone relationships between files
US10503605B2 (en) * 2017-09-25 2019-12-10 ArcServe (USA) LLC Method of detecting source change for file level incremental backup
CN110998537B (zh) * 2017-12-26 2022-09-02 华为技术有限公司 一种过期备份处理方法及备份服务器
CN108874589A (zh) * 2018-06-11 2018-11-23 许世昌 一种电力厂站综合自动化系统主机及工作站数据统一备份系统
CN110209527B (zh) 2018-11-30 2023-05-05 腾讯科技(深圳)有限公司 数据恢复方法、装置、服务器以及存储介质
US11762575B2 (en) 2019-07-31 2023-09-19 Hewlett-Packard Development Company, L.P. Updates to flash memory based on determinations of bits to erase
US11379024B2 (en) * 2019-09-26 2022-07-05 Micron Technology, Inc. Systems and methods capable of bypassing non-volatile memory when storing firmware in execution memory
KR102427418B1 (ko) * 2019-09-27 2022-08-01 주식회사 데이타커맨드 백업 데이터 합성 장치 및 방법
CN110851302B (zh) * 2019-10-31 2021-06-18 上海爱数信息技术股份有限公司 一种数据库信息的备份方法及恢复方法
KR102367733B1 (ko) * 2019-11-11 2022-02-25 한국전자기술연구원 정책기반 멀티레벨 PreChecker에 의한 고속 블록 중복 제거 및 전송 방법
US11372732B2 (en) 2020-02-25 2022-06-28 Veritas Technologies Llc Systems and methods for agentless and accelerated backup of a database
US11822435B2 (en) 2020-07-06 2023-11-21 Bank Of America Corporation Consolidated data restoration framework
KR20220101939A (ko) * 2021-01-12 2022-07-19 삼성전자주식회사 데이터 백업을 지원하는 전자 장치 및 그 운용 방법
US11782803B2 (en) 2021-09-24 2023-10-10 EMC IP Holding Company LLC System and method for snapshot cleanup and report consolidation
US11836050B2 (en) * 2021-09-30 2023-12-05 EMC IP Holding Company LLC Methods and systems for differential based backups

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4959774A (en) * 1984-07-06 1990-09-25 Ampex Corporation Shadow memory system for storing variable backup blocks in consecutive time periods
JPH0827754B2 (ja) * 1992-05-21 1996-03-21 インターナショナル・ビジネス・マシーンズ・コーポレイション コンピュータシステムにおけるファイル管理方法及びファイル管理システム
JP3260923B2 (ja) * 1993-09-20 2002-02-25 富士通株式会社 データ処理システムのバックアップ制御装置及び方法
WO1995013580A1 (en) * 1993-11-09 1995-05-18 Arcada Software Data backup and restore system for a computer network
US5574906A (en) * 1994-10-24 1996-11-12 International Business Machines Corporation System and method for reducing storage requirement in backup subsystems utilizing segmented compression and differencing
US5907672A (en) * 1995-10-04 1999-05-25 Stac, Inc. System for backing up computer disk volumes with error remapping of flawed memory addresses
US6167494A (en) 1998-04-28 2000-12-26 International Business Machine Corporation Method and system for recovering from operating system failure
US6366986B1 (en) * 1998-06-30 2002-04-02 Emc Corporation Method and apparatus for differential backup in a computer storage system
US6141773A (en) * 1998-06-30 2000-10-31 Emc Corporation Method and apparatus for undoing changes to computer memory
US6920537B2 (en) * 1998-12-31 2005-07-19 Emc Corporation Apparatus and methods for copying, backing up and restoring logical objects in a computer storage system by transferring blocks out of order or in parallel
JP3321455B2 (ja) * 1999-04-02 2002-09-03 株式会社アークテック 電極引張試験方法、その装置及び電極引張試験用の基板/プローブ支持装置並びに電極プローブ接合装置
US6959368B1 (en) * 1999-06-29 2005-10-25 Emc Corporation Method and apparatus for duplicating computer backup data
JP2002055783A (ja) * 2000-06-02 2002-02-20 Fujitsu Ltd ディスク間の複写処理装置、複写処理方法、およびその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US6526419B1 (en) 2000-06-09 2003-02-25 International Business Machines Corporation Method, system, and program for remote copy in an open systems environment
US6675177B1 (en) * 2000-06-21 2004-01-06 Teradactyl, Llc Method and system for backing up digital data
US6665815B1 (en) * 2000-06-22 2003-12-16 Hewlett-Packard Development Company, L.P. Physical incremental backup using snapshots
US6990547B2 (en) * 2001-01-29 2006-01-24 Adaptec, Inc. Replacing file system processors by hot swapping
US6985915B2 (en) * 2001-02-28 2006-01-10 Kiran Somalwar Application independent write monitoring method for fast backup and synchronization of files
US6516394B1 (en) 2001-03-02 2003-02-04 Emc Corporation System and method for management of storage devices using labels
US20020147733A1 (en) * 2001-04-06 2002-10-10 Hewlett-Packard Company Quota management in client side data storage back-up
US6826666B2 (en) * 2002-02-07 2004-11-30 Microsoft Corporation Method and system for transporting data content on a storage area network
CA2497625A1 (en) * 2002-09-10 2004-03-25 Exagrid Systems, Inc. Method and apparatus for managing data integrity of backup and disaster recovery data
JP2004164226A (ja) 2002-11-12 2004-06-10 Seer Insight Security Inc 情報処理装置およびプログラム
US7739240B2 (en) * 2002-12-09 2010-06-15 Hewlett-Packard Development Company, L.P. Replication and replica management in a wide area file system
US7092976B2 (en) * 2003-06-24 2006-08-15 International Business Machines Corporation Parallel high speed backup for a storage area network (SAN) file system
US7047380B2 (en) * 2003-07-22 2006-05-16 Acronis Inc. System and method for using file system snapshots for online data backup
US7146476B2 (en) * 2003-08-05 2006-12-05 Sepaton, Inc. Emulated storage system
US7103740B1 (en) * 2003-12-31 2006-09-05 Veritas Operating Corporation Backup mechanism for a multi-class file system
US7206911B2 (en) * 2004-02-25 2007-04-17 International Business Machines Corporation Method, system, and program for a system architecture for an arbitrary number of backup components
US7366858B2 (en) * 2004-09-09 2008-04-29 Microsoft Corporation Framework for taking shadow copies and performing backups in a networked environment

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101449269B (zh) * 2006-05-10 2012-12-12 伊姆西公司 自动优先恢复
CN100449501C (zh) * 2006-09-21 2009-01-07 上海交通大学 计算机网络数据恢复的方法
CN100524238C (zh) * 2007-11-02 2009-08-05 西安三茗科技有限责任公司 基于块级的增量备份和整卷恢复的方法
CN101853194B (zh) * 2009-04-03 2011-12-14 纬创资通股份有限公司 数据备份方法
CN102959518B (zh) * 2009-12-22 2016-01-13 国际商业机器公司 把文件系统恢复到目标存储器的计算机执行的方法和系统
CN102959518A (zh) * 2009-12-22 2013-03-06 国际商业机器公司 使用多个同时装置流的完全系统备份和增量备份的恢复
CN102375700A (zh) * 2010-08-26 2012-03-14 湖北盛天网络技术有限公司 一种直接更新硬盘数据的方法
CN102375700B (zh) * 2010-08-26 2014-03-19 湖北盛天网络技术股份有限公司 一种直接更新硬盘数据的方法
CN103262043A (zh) * 2010-09-29 2013-08-21 赛门铁克公司 从差异备份中执行数据库的精细恢复的方法和系统
CN103262043B (zh) * 2010-09-29 2016-05-18 赛门铁克公司 从差异备份中执行数据库的精细恢复的方法和系统
CN102117209A (zh) * 2010-12-20 2011-07-06 深圳市科陆电子科技股份有限公司 一种web系统中对中间数据定时处理的方法
CN103793296A (zh) * 2014-01-07 2014-05-14 浪潮电子信息产业股份有限公司 一种在集群中用于辅助备份复制计算机系统的方法
CN103902336A (zh) * 2014-03-13 2014-07-02 深圳创维-Rgb电子有限公司 操作系统启动控制的方法及装置
CN105739913B (zh) * 2014-12-12 2019-04-05 华为技术有限公司 一种磁盘分区排布方法及装置
CN105739913A (zh) * 2014-12-12 2016-07-06 华为技术有限公司 一种磁盘分区排布方法及装置
WO2016145838A1 (zh) * 2015-08-03 2016-09-22 中兴通讯股份有限公司 一种元数据管理方法及装置、分布式文件系统
CN105162869B (zh) * 2015-09-18 2019-01-18 久盈世纪(北京)科技有限公司 一种用于数据备份管理的方法与设备
CN105162869A (zh) * 2015-09-18 2015-12-16 久盈世纪(北京)科技有限公司 一种用于数据备份管理的方法与设备
CN106412200A (zh) * 2016-10-08 2017-02-15 四川秘无痕信息安全技术有限责任公司 一种提取wp系统联系人数据的方法
CN106412200B (zh) * 2016-10-08 2019-12-03 四川秘无痕科技有限责任公司 一种提取wp系统联系人数据的方法
CN108509641A (zh) * 2018-04-11 2018-09-07 北京小米移动软件有限公司 文件备份的方法、装置、服务器以及系统
CN108509641B (zh) * 2018-04-11 2022-05-06 北京小米移动软件有限公司 文件备份的方法、装置、服务器以及系统
CN111367856A (zh) * 2020-02-28 2020-07-03 杭州宏杉科技股份有限公司 数据复制方法、装置、电子设备及机器可读存储介质
CN111367856B (zh) * 2020-02-28 2024-03-29 杭州宏杉科技股份有限公司 数据复制方法、装置、电子设备及机器可读存储介质
CN111581013A (zh) * 2020-03-18 2020-08-25 宁波送变电建设有限公司永耀科技分公司 基于元数据和影子文件的系统信息备份与重构方法

Also Published As

Publication number Publication date
US20100274763A1 (en) 2010-10-28
JP2006092553A (ja) 2006-04-06
EP1640868A3 (en) 2012-10-03
AU2010246446B2 (en) 2012-06-21
KR101153023B1 (ko) 2012-06-11
EP1640868A2 (en) 2006-03-29
JP4807992B2 (ja) 2011-11-02
US8533189B2 (en) 2013-09-10
AU2005203663A1 (en) 2006-04-06
KR20060050742A (ko) 2006-05-19
CA2516102A1 (en) 2006-03-22
MXPA05009680A (es) 2006-03-27
EP1640868B1 (en) 2013-11-20
AU2010246446A1 (en) 2010-12-16
AU2005203663B2 (en) 2011-06-16
CN1752939B (zh) 2011-06-22
US7756833B2 (en) 2010-07-13
BRPI0503703A (pt) 2006-05-02
US20060064444A1 (en) 2006-03-23

Similar Documents

Publication Publication Date Title
CN1752939A (zh) 用于综合备份和恢复的方法和系统
US11599557B2 (en) System and method for persistence and replication of changes to a data store
CN101243446B (zh) 从数据库镜像进行在线页还原
Tan et al. SAM: A semantic-aware multi-tiered source de-duplication framework for cloud backup
US6978282B1 (en) Information replication system having automated replication storage
US7814056B2 (en) Method and apparatus for data backup using data blocks
US8010514B2 (en) System and method for a distributed object store
US7865473B2 (en) Generating and indicating incremental backup copies from virtual copies of a data set
US7096250B2 (en) Information replication system having enhanced error detection and recovery
CN1149480C (zh) 文件存储装置
US7421617B2 (en) Systems and methods for optimizing restoration of stored data
CN102299904B (zh) 一种实现业务数据备份的系统及方法
US9377964B2 (en) Systems and methods for improving snapshot performance
US20070027935A1 (en) Backing up source files in their native file formats to a target storage
CN1916862A (zh) 把存储单元和相关元数据复制到存储器的方法和系统
CN1784682A (zh) 用于自动数据库或文件系统维护和修复的系统和方法
US20110225141A1 (en) Distributed Catalog, Data Store, and Indexing
CN1702627A (zh) 执行拷贝操作的方法和系统
CN1653427A (zh) 用于创建虚拟数据拷贝的方法和装置
US9785514B1 (en) Techniques for file system recovery
US8631272B2 (en) Duplicate-aware disk arrays
CN102193844A (zh) 基于部分块的备份
CN1788256A (zh) 用于增量虚拟复制的方法、系统和程序
CN1818877A (zh) 元数据复制和复原的方法与系统
CN1764901A (zh) 用于将计算机中的文件、目录和面向应用的文件的至少一个恢复成先前状态的设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110622

Termination date: 20140922

EXPY Termination of patent right or utility model