您现在的位置是:首页 > 测评

存储备份设计?备份是干什么的

867HJcbeopms 2024-04-15

一、架构设计:文件服务存储设计

在架构设计:文件服务的设计与实现一文中,通过实现一个文件服务来梳理了一个架构设计的一般流程,并得到如下静态架构图

本文继续聊聊文件服务中的子模块:「存储模块」的设计,包括:

前面的架构没有对存储进行特别设计,直接使用了本地存储。考虑到后期文件数量可能会越来越多,本地存储可能无法支撑,且本地存储的安全性也没有保障。为了便于后期扩展,需要对「存储」部分进行设计。

存储的方式有很多,本地存储、NAS、分布式存储,为了能支持不同的存储方式,需要对「存储模块」进行抽象。考虑到「存储模块」涉及到IO,是一个相对底层的模块。「上传」这个核心模块不能依赖于具体的存储,所以这里也需要对其进行依赖反转。

见紫色部分,UploadService调用了FileInfoRepository来存储FileInfo,而FileInfoRepository是个接口,具体实现由存储模块中的实现类来实现。

我们先看本地存储。最简单的实现,就是直接使用IO将文件写到对应的目录下就可以了。但是,本地存储会有如下几个问题:

下面我们针对上面的问题,来一个个的解决。

首先,对于多租户来说,在我们的架构中,实际对应的是Group,我们按照Group的不同,来划分目录即可。即不同的租户有不同的文件根目录,后期某个租户迁移时,直接迁移对应目录即可。这也稍微解决了单目录文件数量多的问题。

对于单目录下,随着文件数量的增加导致访问速度下降的问题,我们该如何解决呢?

如果你做过分布式系统,那么想一想,我们是否可以把单目录看成是一个服务器,访问目录下的文件看成是一个个的请求呢?如果可以,那解决单目录下访问速度慢的问题是不是就变成了「如何解决单服务器下,负载过高」的问题了?那解决服务端负载过高的方法是否适用于解决目录访问速度下降的问题呢?

我们从下面几个方面来分析一下:

首先来看「解决服务端负载过高的方法」!答案很明显:分流+负载均衡!

分布式服务的负载均衡有几种方式呢?

再来看「目录访问和服务器的区别」,虽然可以把目录看成服务器,但是两者还是有区别的:

也就是说,对于目录来说,我们不需要考虑创建成本。

那么针对服务器负载高的解决方案是否适合目录访问呢?或者哪种方式适合目录访问呢?我们一个个来分析:

可以看到,主要的问题就是创建目录的问题!如何保证在目录数量改变时,不需要调整程序呢?

实际上git已经给出了答案:

也就是说,根据sha1散列的前两位对文件进行归类。这样既解决了目录创建问题,也解决了文件分布问题。可能的问题是,「sha1散列2^80次,可能会发生一次碰撞」。这个问题对于一般文件系统来说,好像也没有担心的必要。

解决了「单目录文件过多,导致访问速度下降」的问题,我们来看下一个问题:数据安全。

文件数据是存放在电脑磁盘上的,如果硬盘损坏,可能导致文件的丢失。这实际还是一个「单点问题」!

「单点问题」的解决方案是什么呢?冗余啊!

最简单的方案就是定时去备份数据,可以有如下几种方案:

我们继续一个个的讨论。

首先是人工备份,这是最low的方案,当然也是最简单的,即有人定期去备份就行了。问题是时效性不高,例如一天备份一次,如果磁盘在备份前坏了,那就会丢失一天的数据。同时恢复比较耗时,需要人工处理。

第二个方案是代码实现,即在上传文件时,程序就自动备份。以上面的架构为例,可以添加一个BackupListener,当上传完成后,通过事件,自动备份上传的文件。同时下载时需要判定文件是否完整,如果有问题则使用备份数据。此方案时效性得到了保障,但是将数据备份和业务放到了一起,且需要编码实现,增加了业务代码量。

第三个方案是 libfuse,libfuse是用户态文件系统接口。下面是libfuse官方简介:

简单来说,就是可以用libfuse构建一个用户态文件系统。之前在老东家做了一个日志分析平台,日志的收集就使用了libfuse,大致架构如下:

业务系统写日志到挂载的用户态文件系统中,用户态文件系统自动转发到了后续的处理中间件:redis、消息队列、文件系统。

在这里也可以用类似的功能,即在文件上传后,用户态文件系统自动备份。此方案解耦了文件备案逻辑与业务逻辑。

最后一个方案是 RAID,即廉价冗余磁盘阵列。RAID不但可备份文件,还支持并发读写,提高上传下载速率。

常用的RAID有:RAID0,RAID1,RAID01/RAID10,RAID5和RAID6等。我们来看看这几种RAID的特点,以及是否适用于我们的文件服务。你会发现从RAID0到RAID6,又是一个从单点到分布式的过程。

看下面的两张图应该能更好的理解:

无论是RAID10还是RAID01,对磁盘的使用效率都不高。那如何提高磁盘使用率呢?就有了RAID3。

对于本地存储来说,RAID是个相对实用的解决方案,既能提高数据安全、快速扩容,也提高了读写速率。但是无论扩展多少磁盘,容量还是相对有限,吞吐也相对有限,同时由于其还是单点,如果文件服务本身挂掉,就会导致单点故障。所以就有了分布式文件系统。

分布式文件系统下次单独讨论!

最后打个广告,帮朋友开的专栏《零基础Unity3D游戏开发》,适合没有基础、想从事游戏开发的小白!朋友从事游戏多年,开发了多款游戏,收了30多个徒弟,技术杠杠的!

二、备份是干什么的

名词解释

备份:为应付文件、数据丢失或损坏等可能出现的意外情况,将电子计算机存储设备中的数据复制到磁带等大容量存储设备中。从而在原文中独立出来单独贮存的程序或文件副本。(摘自《计算机科学》)

如果系统的硬件或存储媒体发生故障,“备份”工具可以帮助您保护数据免受意外的损失。例如,可以使用“备份”创建硬盘中数据的副本,然后将数据存储到其他存储设备。备份存储媒体既可以是逻辑驱动器(如硬盘)、独立的存储设备(如可移动磁盘),也可以是由自动转换器组织和控制的整个磁盘库或磁带库。如果硬盘上的原始数据被意外删除或覆盖,或因为硬盘故障而不能访问该数据,那么您可以十分方便的从存档副本中还原该数据。

备份分类

备份可以分为系统备份和数据备份。

1、系统备份:指的是用户操作系统因磁盘损伤或损坏,计算机病毒或人为误删除等原因造成的系统文件丢失,从而造成计算机操作系统不能正常引导,因此使用系统备份,将操作系统事先贮存起来,用于故障后的后备支援。

2、数据备份:指的是用户将数据包括文件,数据库,应用程序等贮存起来,用于数据恢复时使用。

备份作用

备份的作用是用于后备支援,替补使用。

备份是容灾的基础,是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的过程。传统的数据备份主要是采用内置或外置的磁带机进行冷备份。但是这种方式只能防止操作失误等人为故障,而且其恢复时间也很长。随着技术的不断发展,数据的海量增加,不少的企业开始采用网络备份。网络备份一般通过专业的数据存储管理软件结合相应的硬件和存储设备来实现。

备份方式

比较常见的备份方式有:

定期磁带备份数据。

远程磁带库、光盘库备份。即将数据传送到远程备份中心制作完整的备份磁带或光盘。[1]

远程关键数据+磁带备份。采用磁带备份数据,生产机实时向备份机发送关键数据。

远程数据库备份。就是在与主数据库所在生产机相分离的备份机上建立主数据库的一个拷贝。

网络数据镜像。这种方式是对生产系统的数据库数据和所需跟踪的重要目标文件的更新进行监控与跟踪,并将更新日志实时通过网络传送到备份系统,备份系统则根据日志对磁盘进行更新。

远程镜像磁盘。通过高速光纤通道线路和磁盘控制技术将镜像磁盘延伸到远离生产机的地方,镜像磁盘数据与主磁盘数据完全一致,更新方式为同步或异步。

数据备份必须要考虑到数据恢复的问题,包括采用[2]双机热备、磁盘镜像或容错、备份磁带异地存放、关键部件冗余等多种灾难预防措施。这些措施能够在系统发生故障后进行系统恢复。但是这些措施一般只能处理计算机单点故障,对区域性、毁灭性灾难则束手无策,也不具备灾难恢复能力。

备份技术

系统灾难恢复

(IDR=Intelligent Disaster Recovery)

系统灾难恢复,就是在系统出现崩溃的时候,能够用非常少的步骤,将系统重建,包括上面的系统补丁、应用软件和数据。这样可以提高恢复的准确性、缩短恢复时间、缩短业务中断时间。

主要[3]灾备技术,在恢复的时候有这么几种方式:

采用公用的一张光盘,所有的系统都采用这一张光盘。这个光盘可以启动系统,同时可以启动网络,然后备份服务器将备份在磁带库(或者虚拟带库)中的整个硬盘内容或者第一主分区内容恢复到灾难机。这样不论灾难机原来有多大容量数据,都可以存放在整个备份系统的备份设备中,统一进行管理,而且不需要经常刻光盘,也就是说光盘不需要经常更新。比较典型的代表是BakBone NetVault VaultDR。右图是BakBoneNetVault VaultDR灾难备份和恢复的数据流,所有系统采用统一的光盘进行。

需要针对每台计算机单独刻光盘,恢复的时候需要利用针对性的光盘来恢复,每台机器都需要自己的光盘,而且需要定期不断更新。这种方式的最大不足是经常要刻光盘,否则灾难出现的时候如果没有光盘或者光盘太久了,都会影响恢复的速度和恢复后的状态。这种技术的典型代表是EMC NetWork Recovery Manager模块。

恢复时需要借助网络启动,也就是需要具备一台相同操作系统的主机作为引导机器,然后利用备份的内容进行恢复。这种技术的典型代表是Symantec NetBackup的Bare Metal Restore(裸金属恢复)模块。

操作系统自己提供的灾备工具。对于大多数Unix小型机,都提供系统备份工具。借助于系统自身提供的磁带机,利用一个简单的命令,HP-UX采用make_recovery就可以把整个root卷备份到服务器自带的4mm磁带上。在恢复的时候,这盘磁带可以自启动系统,采用一个命令就可以将整个root卷恢复到硬盘上。这种方式的好处是简单和经济,尤其对于Unix系统,这样的方式远比备份软件提供的BMR模块方便、安全和经济,因为备份软件提供的BMR模块往往需要相同平台的其他服务器来启动。

数据远程复制

将数据在另外的地方实时产生一份可用的副本,此副本的使用不需要做数据恢复,可以将副本立即投入使用。数据复制的最大好处是副本数据立即可用,没有数据恢复时间,RTO非常好,同时因为是实时复制,RPO也非常好,几乎不会丢失数据。缺点是费用远比数据备份要高,不仅仅是数据复制系统价格高,还需要另外的硬盘存储空间和主机系统,甚至建立另外的远程机房,考虑网络布线,这些都将带来成本大大增加,所以数据复制的建设和维护费用远远大于数据备份。

数据复制目前有如下实现方式:

基于主机。基于主机的数据复制技术,可以不考虑存储系统的同构问题,只要保持主机是相同的操作系统即可,存在支持异构主机之间的数据复制软件,如BakBone NetVault Replicator就可以支持异构服务器之间的数据复制,可以支持跨越广域网的远程实时复制。缺点是需要占用一点主机资源。

基于存储系统。利用存储系统提供的数据复制软件,复制的数据流通过存储系统之间传递,和主机无关。这种方式的优势是数据复制不占用主机资源,不足之处是需要灾备中心的存储系统和生产中心的存储系统有严格的兼容性要求,一般需要来自同一个厂家的存储系统,这样对用户的灾备中心的存储系统的选型带来了限制。

基于光纤交换机。这项技术正在发展中,利用光纤交换机的新功能,或者利用管理软件控制光纤交换机,对存储系统进行虚拟化,然后管理软件对管理的虚拟存储池进行卷管理、卷复制、卷镜像等技术,来实现数据的远程复制。比较典型的有Storag-age,Falcon等。

基于应用的数据复制。这项技术有一定局限性,都是针对具体的应用。主要利用数据库自身提供的复制模块来完成,比如OracleDataGuard,SybaseReplication等。

数据保护技术

CDP(Continuous Data Protection)

CDP技术是目前最热门的数据保护技术,它可以捕捉到一切文件级或数据块级别的数据写改动,可以对备份对象进行更加细化的粒度的恢复,可以恢复到任意时间点。

CDP技术是一个新兴的技术,在很多传统的备份软件中都逐渐融入了CDP的技术。比如BakBone NetVault Backup 8.0追加了TrueCDP模块,Symantec Backup Exec12.5等。其他公司包括EMC,Symantec都并购了一些CDP的软件,正在和传统地备份软件进行整合,还都在整合中。

CDP技术包括两种:

Near CDP,就是我们说的准CDP,它的最大特点是只能恢复部分指定时间点的数据(FPIT,Fixed Point In Time),有点类似于存储系统的逻辑快照,它无法恢复任意一个时间点。如Symantec、CommVault、凯备份的CDP都属于这种类型。

TrueCDP,我们称之为真正的CDP,它可以恢复指定时间段内的任何一个时间点(APIT,Any Point In Time),而BakBone TrueCDP属于TrueCDP类型。

当前应用情况

如果采用灾备方案的分布在各个行业,不过大家都是按照一定的梯度来使用。

首先采用的是系统灾难备份(BMR Bare Metal Recovery),因为这种方案成本最低,只要在建设数据备份系统的时候追加一些模块就可以完成。不需要附加的存储空间,也不需要附加的[4]容灾机房,所以,有条件的用户几乎都可以实施。只不过有的用户采用操作系统提供的备份工具来辅助,有的用户采用备份软件提供的灾难模块来完成。这样的用户数量最大,分布在各个行业。BakBone的VaultDR在使用BakBone NetVault的备份软件用户中被广泛采用。很多用户非常喜欢BakBone VaultDR不用关心操作系统类型,而且一张标准光盘可以应用到所有Intel x86服务器进行灾难备份和恢复。

其次是建立容灾系统的用户,大数据量的高端企业普遍采用基于存储的数据复制技术,比如电信、金融行业。中低端用户普遍采用基于主机的数据复制软件,成本较低,而且不需要进行严苛的存储系统采购,尤其是BakBone的NetVault Replicator不但可以进行远程数据复制,而且可以支持异构平台,所以在国内外有广泛的用户,一些政府部门、电力公司、证券部门、网站公司等都采用这种方式,而且大多运用在Windows、Linux平台。基于存储交换机层的虚拟存储技术虽然也在有了一些用户,但是因为此技术起步时间有限,技术成熟度需要进一步验证,很多用户只是做为试点,没有大范围的展开。对于基于应用的数据复制方式,也有部分高端客户在采用,而且也有大量的用户。

对于CDP技术,才刚刚起步,这种技术满足了很多关心灾备的用户的需求,在RTO和RPO方面都能得到很高的标准,同时还可以进行任意历史版本的重现,正在被越来越多的用户所关注,相信将来会有非常广泛的用户。BakBone的TrueCDP可以进行任意时间点的恢复,是真正意义上的CDP,将会比其他准CDP产品有更大的优势,会被更多关心灾备的用户所选用。

应用误区

灾备系统因为能够带来业务的连续性,正越来被大家所重视,但是在使用过程中也要切记出现一些误区。

没有选择适合自己的。没有仔细分析和明确业务连续要求,对RTO和RPO没有进行仔细研究,要么不做,要做就想追求最全面的,这样可能忽视了最需要的建设,没有切实满足自己的需要。

认为灾备系统是万能的,夸大灾备系统的作用,忽视了备份系统、高可用系统的建设。其实各个系统都有自己的作用,需要根据实际需求进行建设。

没有有步骤分阶段的进行灾备建设,总想等实际成熟的时候全面建设,甚至还没有先进行数据备份系统的建设,就开始着手进行灾备系统建设。不进行备份系统建设,就没有满足数据安全的底线,在关键时刻缺少一份完整的数据,而花费大量的财力进行灾备系统建设,反而得不偿失。

多种灾备技术的选用不合理,比如主机系统的资源可以接受基于主机的复制软件来运行,却选用了基于存储系统的设计,造成必须选用相同类型的存储设备,增加了总体费用。

对BMR系统灾难备份总是希望选用备份软件自带的BMR模块。其实,备份软件自带的BMR模块对于Window和Linux比较方便,但并不是对于所有的Unix系统都合适,在Unix系统备份方面,Unix自带的系统备份工具和自带的磁带机就非常方便,一个命令就可以完成系统备份,还不用依赖于其他服务器,远远胜于一些备份软件自带的BMR模块,不但操作方便,而且减少费用。

未来发展方向

未来的技术发展应该是多种技术并存,而且越能满足客户需求的方式更能得到客户的关注。

未来的发展之一应该是基于主机的异构复制技术会有更广泛的市场。因为大多数客户具备异构主机环境,支持异构环境的数据复制技术,就可以利用现有环境,各台主机之间互为复制。对于不支持异构环境的复制软件,就需要购买相同的存储或者购买相同操作系统的主机进行数据复制,增加了灾备的总体费用。

未来的发展之二就是CDP技术。CDP融合了数据备份和数据复制的优点,既可以进行实时数据保护,还可以任意时间点的历史数据恢复,将会具有更加强大的生命力。随着TrueCDP和传统备份软件的无缝衔接,将会有越来越多的用户采用TrueCDP进行灾备系统建设。右图是广为流行的BakBone NetVault TureCDP备份系统架构图。

备份系统

备份系统的作用

很多系统管理员认为,投资建立一个备份任务的管理,较原来复杂的备份系统只是在恢复的时候才起作用有些浪费,并且平时增添了很多的管理任务,这对于企业来说是一个大的浪费。

这个问题是一个大问题,直接涉及到对于一个企业的信息系统的投资回报率(ROI)。当IT系统的重要性非常高,企业的关乎生命的数据都在计算机系统里面,那么数据的保护就非常重要,这是其一。另外,实施备份系统并不会带来更多的管理任务,相反为系统管理员带来了很多维护上的方便,主要有以下几点:

备份的自动化,降低由维护员的操作带来的风险;

数据库在线备份,保证24×7小时业务运行;

文件系统及数据库数据的时间点恢复,历史版本管理;

磁带的复制(Cloning),可降低磁带的出错几率和实现异地容灾保存;

网络备份、LAN-Free及Serverless多种备份方式;

系统灾难快速恢复。

因此,如果企业必须实现上述功能,而企业又不实施备份系统时,需要的人力及设备的投资如果大于实施备份系统的投资,则该备份系统的投资是可以被接受的。

备份系统的功能

用户只需要简单的备份就可以了,不必要那么复杂。用户买了很多备份系统中没有用处的先进技术,没有必要在系统中实现过多的复杂功能。

备份系统实现的功能是备份技术发展到一定阶段的产物,先进技术的出现也由于用户的系统中有这样的需求。当IT系统发展到一定程度,用户对IT系统的依赖型增强,IT系统的数据量越来越大,对系统备份的要求就水涨船高。但好的备份系统应该有如下的特点:

备份系统可根据应用系统的需要非常容易地进行扩展;

满足未来的数据量及应用系统升级带来的备份系统的压力;

备份系统中,尤其是备份软件的可升级能力。

总体来说,备份技术已经经历了几个发展阶段,从传统的磁带备份到网络备份,从SCSILAN-Free备份到SAN结构的动态共享LANFree备份,直到出现的Serverless备份。可以预见,未来备份产品有以下几个趋势:

磁盘备份

状况

随着SATA磁盘价格进一步下降,磁盘的备份优势逐渐体现出来。EMC已经推出了使用磁盘作为虚拟磁带库的产品,在功能上可以替代磁带库的功能。笔者认为,该产品的大批量投放市场,会在一定程度上引发备份硬件设备的升级换代。

iSCSI技术

该技术可以利用现有的TCP/IP网络进行数据传输,用户可以很方便地实现数据的远程异地保护。市场上已经出现了较多这样的产品,相信随着产品的成熟,会有很多异地备份和容灾方案会选择该技术。

NDMP协议

NDMP(网络数据管理协议)作为一种标准,已经发展到了Version 4,支持该协议的产品,可以非常方便地实现NAS服务器数据的快速备份和恢复。对于大数量的小文件,该技术有着得天独厚的优势。

备份技术

很多的磁盘阵列都提供了SnapShot功能,而对于磁盘阵列上的SnapShot,我们可以充分利用SnapShot技术进行数据的Serverless备份,这对于企业级的大型系统有着十分重要的意义,极大地降低了备份时对于生产系统的资源占用,并且可以非常快速地恢复。

实现备份介质的生命周期管理

通常每盘磁带都有一定的使用次数限制,因此,对于磁带备份系统来说,磁带使用了一定次数后,就应该摒弃掉,不能用来备份关键数据。

维护

人们投资购买了全自动的备份系统,目的就是降低维护工作量,只要实施了该系统,维护工作就可以放松了,只要过一周或者一个月检查一下备份的状态就可以了。

当用户实施了备份系统后,对于备份系统的维护工作仍然非常重要。主要由以下因素决定。

由于很多单位IT系统的主机很多,应用系统很多,并且每套应用系统都有相应的管理和维护人员,备份是各种应用数据备份任务的集中管理。因此对于应用系统较为复杂的用户来说,可以设立备份系统管理员或者存储备份工程师,对整体备份系统进行维护。

随着数据量的增大,应用系统的增长,备份策略随着时间的迁移应进行优化。

备份系统涉及的技术包括操作系统、数据库、存储、磁带库等诸多技术,因此建议备份系统管理员对各种知识有一定的了解,并且除了参加备份系统知识的培训外,还要参加操作系统、数据库等产品的专业培训,以保证应用系统在出现灾难时尽快实现数据的恢复。

关键数据库的日常备份如果失败,可能导致数据库的挂起。例如,对于[5]Oracle数据库来说,如果不及时对数据库的“归档日志”进行备份,则会导致整个数据库的停止。

如果磁带库备份系统中有“克隆”的功能,还需要每日将“克隆”的介质取出,放置到异地保存,以利于容灾。

产品

在选择产品时,备份磁带库容量尽可能大,磁带机速度尽可能快,尽可能使用最先进的技术。

在产品的选择过程中,性价比是最重要的指标之一,但绝不是全部。建议用户在选择产品的时候考虑以下几个因素:

本系统应用数据的类型、数据量、备份策略(全备份、增量备份等)及关键数据的保留时间决定了磁带库的总容量;

备份时间窗口和备份数据量的峰值数据量决定了磁带机的最低数量;

应用系统的种类和数据类型决定备份时采用哪些技术。

如用NAS设备备份,尽量选择NDMP备份;SAN架构备份尽量选用磁带机动态共享;磁盘阵列提供了镜像或者SNAP功能,可以使用SnapShot备份技术。

磁带机技术的选择方面,建议选择较为通用的设备,对于该磁带机来说,操作系统及备份软件对其兼容的程度较好。

由于磁带机属于机械设备,故障率较磁盘、光盘等设备要高,因此配置磁带机时尽量保持冗余。SATA磁盘技术有了突飞猛进的发展,磁盘备份技术已经成为了发展方向。

硬件设备考虑备件的提供情况及提供商的服务水平,而对于备份软件来说,提供专业服务及技术支持也是需要考虑的重要因素。

备份软件应该具有较广泛的兼容性。

数据容灾

企业关键数据丢失会中断企业正常商务运行,造成巨大经济损失。要保护数据,企业需要备份容灾系统。但是很多企业在搭建了备份系统之后就认为高枕无忧了,其实还需要搭建容灾系统。数据容灾与数据备份的联系主要体现在以下几个方面:

数据备份基础

数据备份是数据高可用的最后一道防线,其目的是为了系统数据崩溃时能够快速的恢复数据。虽然它也算一种容灾方案,但这种容灾能力非常有限,因为传统的备份主要是采用数据内置或外置的磁带机进行[6]冷备份,备份磁带同时也在机房中统一管理,一旦整个机房出现了灾难,如火灾、盗窃和地震等灾难时,这些备份磁带也随之销毁,所存储的磁带备份也起不到任何容灾功能。

容灾与备份

真正的数据容灾就是要避免传统冷备份所具有先天不足,它能在灾难发生时,全面、及时地恢复整个系统。容灾按其容灾能力的高低可分为多个层次,例如国际标准SHARE 78定义的容灾系统有七个层次:从最简单的仅在本地进行磁带备份,到将备份的磁带存储在异地,再到建立应用系统实时切换的异地备份系统,恢复时间也可以从几天到小时级到分钟级、秒级或0数据丢失等。

无论是采用哪种容灾方案,数据备份还是最基础的,没有备份的数据,任何容灾方案都没有现实意义。但光有备份是不够的,容灾也必不可少。容灾对于IT而言,就是提供一个能防止各种灾难的计算机信息系统。从技术上看,衡量容灾系统有两个主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了当灾难发生时允许丢失的数据量;而RTO则代表了系统恢复的时间。

容灾不仅是技术

容灾是一个工程,而不仅仅是技术。很多客户还停留在对容灾技术的关注上,而对容灾的流程、规范及其具体措施还不太清楚。也从不对容灾方案的可行性进行评估,认为只要建立了容灾方案即可高枕无忧,其实这具有很大风险的。特别是在一些中小企业中,认为自己的企业为了数据备份和容灾,整年花费了大量的人力和财力,而结果几年下来根本就没有发生任何大的灾难,于是放松了警惕。可一旦发生了灾难时,后悔晚矣!这一点国外的跨国公司就做得非常好,尽管几年下来的确未出现大的灾难,备份了那么磁带,几乎没有派上任何用场,但仍一如既往、非常认真地做好每一步,并且基本上每月都有对现行容灾方案的可行性进行评估,进行实地演练。[7]

数据容灾等级

设计一个[4]容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等。根据这些因素和不同的应用场合,常见的容灾备份等级有以下四个:

本地冷备份

这一级容灾备份,实际上就是上面所指的数据备份。它的容灾恢复能力最弱,它只在本地进行数据备份,并且被备份的数据磁带只在本地保存,没有送往异地。

在这种容灾方案中,最常用的设备就是[8]磁带机,当然根据实际需要可以是手工加载磁带机,也可以是自动加载磁带机。前者主要适用于存储数据容量较小的中小型企业。

参考资料

1.基于NBU备份系统的磁带库优化与增容方案研究.中国知网[引用日期2017-04-02]

2.双机热备系统的技术研究和具体实现.中国知网[引用日期2017-04-02]

3.云计算在电力系统数据灾备业务中的应用研究.中国知网[引用日期2017-04-02]

4.容灾备份系统中的同步策略研究及效率分析.中国知网[引用日期2017-04-02]

5.Oracle数据库优化探究.中国知网[引用日期2017-04-02]

6.前兆管理系统数据库冷备份及恢复方法实现.中国知网[引用日期2017-04-02]

7.容灾的理论与关键技术分析.中国知网[引用日期2017-04-02]

8.磁带机控制程序的研究与实现.中国知网[引用日期2017-04-02]

本文引用自北京大学姚远教授,来源于百度百科

附链接:网页链接

三、数据存储总体结构设计时应遵循的主要原则

数据存储总体结构设计时应遵循的主要原则是合理性、可扩展性、安全性和易用性。

1、合理性。

数据存储总体结构的设计应符合业务需求和数据特点,能够有效的确保数据存储的有效性和高效性。合理性意味着选择适当的数据模型和数据库技术,设计合理的表结构和关系,以满足业务操作和数据查询的需求。

2、可扩展性。

数据存储总体结构应具备可扩展性,以适应未来数据量和业务增长的需求。这意味着设计应考虑到数据规模的增加、系统负载的增加等因素,采用适当的数据分区、分表、集群等技术,以确保系统能够扩展和提供良好的性能。

3、安全性。

数据存储总体结构设计应重视数据安全性,确保数据的机密性、完整性和可用性。这包括合理设置数据访问权限、加密数据传输、备份和恢复机制、防止数据泄露和攻击等安全措施,以保护数据的安全性和隐私性。

4、易用性

易用性是数据存储总体结构设计时应遵循的主要原则之一。这意味着设计人员必须优先考虑用户的需求和使用习惯。数据存储结构应该简单易懂、易于维护和易于扩展,以最大程度地方便用户使用和管理数据。

数据存储重要性:

1、决策支持。

数据存储是组织和管理大量数据的过程,有效的数据存储可以提供可靠的数据基础,为决策提供支持。通过对数据进行存储和分析,可以发现趋势、模式和关联,为管理者提供准确的信息,帮助他们做出明智的决策。

2、业务发展。

数据是企业运营和发展的重要资产,对数据进行合理的存储和管理可以提高业务的效率和效益。通过存储和分析数据,企业可以了解客户需求、市场趋势和竞争环境,从而优化产品和服务,提高竞争力。

3、风险管理。

数据存储也有助于风险管理。通过备份和存储数据,可以防止数据丢失和损坏的风险,确保数据的可靠性和安全性。此外,存储数据还有助于遵守法规和合规要求,减少法律风险。

4、组织学习与创新。

数据存储对于组织学习和创新至关重要。通过对过去的数据进行存储和分析,可以发现成功经验和教训,为组织的学习和改进提供参考。同时,数据存储也为创新提供了基础,通过对数据进行挖掘和分析,可以发现新的洞察和机会。

文章版权声明:除非注明,否则均为兜雅网原创文章,转载或复制请以超链接形式并注明出处。