2012年9月20日,“融信息精华 合数据力量——企业存储主题沙龙全国巡展”活动在杭州举办。来自浙江地区领军企业的CIO及信息化方面权威专家、IT管理人员等近80人,以及惠普公司存储顾问王宁、张颖老师到场参与了此次主题研讨。美丽的西子湖畔召开的本盛会,也成为云集浙江省信息化人群、探讨新时代企业信息化与存储转型之路的一次务实交流。
现在,企业需要备份的数据量越来越大,他们对备份越来越重视,但备份的架构越来越复杂,如何对备份设备进行统一的管理,来实现数据中心,或者体验架构的备份,这是目前企业比较关心和需要解决的问题。
会上,惠普存储顾问王宁针对以上问题进行了详细的剖析, 以下是会议相关实录:
王宁:大家觉得,备份管理软件主要做什么事情?备份管理软件它的一个目的是怎么来做这种备份,但是,它更大的目的是做介质的管理,我把数据备到磁带,或者虚拟带库上,我知道这个介质,或者这个备份的目标是什么样的数据,它的备份日期是哪天,另外,它的保存时间是多少,这些实际是备份软件来管理的。备份软件真正的目的是做这些方面的东西,真正备份的功能相对还要差一点,主要的功能是做介质的管理。
现在由于备份的数据量越来越大,用户对备份越来越重视,备份的架构现在越来越复杂,比如说客户,可能一开始只是对单一系统做备份,随着系统的扩展,会有更多的备份软件,或者更多的备份设备部署到里面去,对这些备份设备怎么来进行统一的管理,我可以通过一个统一的备份平台,来实现数据中心,或者体验架构的备份,这是目前我们用户比较关心和需要解决的问题。
备份的原理,技术是什么样?如果要部署一个备份管理平台,你需要有一个备份服务器,在备份服务器上,里面有一个数据库,这个库就是存这些介质的信息,我们叫做控制信息,或者管理信息,都是在这个数据库里面,这是存在备份服务器上。我们讲的备份数据端,比如数据库服务器、文件服务器、应用服务器,这些是数据的源,我需要做备份的地方,这边是应用程序,一般情况下,你在这些端,需要做部署,它的目的是当我要做备份的时候,把用户的数据读出来,读出来交给谁?我们还需要与备份去打交道的接口,它的目的是跟虚拟带库、物理带库等等来打教导,一个完整的备份流程是怎么做的?你在备份服务器端定义备份策略,什么意思?我希望几点几分发起这个备份,备份的数据是什么?我要给它写到哪里去,这是一个完整的备份策略,当这个时间到了以后,备份服务器就会发起这个任务,发起任务之后,它就会去读那个数据,把那些数据读完以后写给它,它真正写到备份的目标,这是一个备份的流程。恢复也一样,当你恢复你具体某一个作业,或者比如说我要恢复昨天晚上6点备的数据的时候,你就在系统里面提交恢复的作业,系统这边会去找你昨天晚上备到哪个磁带上去了,我把那个磁带找回来,把数据读回来,读回来交给它,它就会把这个数据真正写回到原来磁盘的位置上去,这是恢复流程。基本上来讲,备份管理软件就是做这些事情,定一些任务,或者定一些备份的作业,在规定的时间来发起这个作业,这是备份软件来做的一个事情。另外一个事情,备份到目标端之后,这个介质的管理也是他要做的事情。惠普DP这个软件能做什么事?就是我刚才说的这些事情。
这个DP软件需要有些什么样的功能?比如它可以做日常文件的备份、数据库的备份,但是在数据库备份的时候,我们一般要求数据库是做联体备份还是托底备份,数据库打开的时候做备份,还是关掉以后,把数据库停了以后做备份,假设我希望做在线的数据库备份,我要支持数据库联体备份的一些功能,这个在DP里面,可以通过一些选介来实现,相当于买许可,有一个接口,通过这个接口,我能跟数据库配合到一起,支持数据库的在线备份。包括,我可以加密,刚才一开始我们介绍的物理磁带库LTO4和LTO5可以支持硬件加密,我也可以通过备份管理软件来做软件加密,实现的途径不一样,通过实现功能来讲,都可以做这种加密,备份软件也可以做这种加密。这些相当于基本功能以外的扩展功能,你想要这个功能,就把软件功能激活。
我讲的DP是我们备份的软件,通过这个DP,根据应用的需求,它主要是做备份恢复,我所说的应用需求是IPO和IPO应用的需求,可以实行相应数据保护级别,可以来部署来定制,假设我希望做这种不停级的备份,我们也叫零停级的备份,我备份的过程中,应用不停继续跑,我们叫零停机的备份,另外我们可以支持立即恢复,如果原数据有问题,我可以实现快速的恢复,它是通过存储系统的快照或者克隆技术,和DP软件集成在一起,实现这种不停机的备份和立即恢复。如果要求我有这么快的恢复,这么短数据丢失的目标,我就可以采用这种居于磁盘的,快照或者克隆的技术来实现保护。我的ITO如果没有要求这么高,像在第一个题目讲的,可以通过低带宽的复制来实现,包括可以通过物理带库等等方式,具体选择哪种方式,根据我们的需求,根据我们应用的要求来灵活选择,没有必要采用一种技术。
目前,DP在国内有非常多的用户和案例,就不一一列举了。目前的DP版本可以到7,目前DP新的功能,第一个功能叫联合重复数据删除功能,我一开始介绍讲到,去重的引擎,或者去重的功能可以部署在虚拟带库端,可以部署在应用源端,也就是说DP目前可以把去重的引擎部署在DP的A里面,可以实现软件系统,这个是目前DP支持新的功能。另外,现在都在讲云,包括云备份,目前DP我们也支持这种云备份,备份的目标是备到云里面去,传统的备到虚拟带库,现在新的技术,我可以把备份的目标备到云里面去,这是惠普自己管理的一个云,如果用户对数据安全性非常担心的话,用户不希望把数据放出来,我可以采用在数据内部来部署备份目标,如果用户认为这些数据是可以放出来的,为了降低我的成本,我把我的备份目标直接放到云里面去。
另外,现在惠普还支持一种恢复,原来要恢复的时候,你要明确指定恢复哪天备份的数据,现在惠普在去年收购了一家公司叫语意,通过语意来检索,比如像百度谷歌,它的搜索,你打一个关键字,就把这个关键字的信息给你找出来。基于语意的搜索,给你几个不相关的词联结在一起,然后搜出这个结果来。比如举个例子,我要找在南极生存的动物,这种动物特征是什么?比如说胖胖的,走路是什么样的,你把这些信息出具以后,他就自动告诉你这是企鹅,你并没有明确指定,但是他根据你收入的信息理解,然后给你一个理解,这是基于语意的搜索。惠普现在把这种功能集成到我的DP软件里面来,当我恢复的时候,假设我不需要明确指定是哪天备份的数据,根据我的一些印象,我可能需要那天的数据,他就会把相关需要恢复的东西找出来,让你来决定是不是恢复他,这对我们管理相当于简化管理。
这个我重复很多次了,通过惠普备份管理软件,我们在部署这种去重引擎的时候,可以部署在应用程序端,部署在备份服务器端,这个在数据库服务器端,大家可以理解,部署那个去重的东西,离你的数据越近,相当于他对链路的利用率越高。比如我要把这个数据部署在数据库服务器端,从数据服务器出来的数据就是去重的数据,假设你把去重的引擎部署在备份服务器端,相当于你从数据库服务器到备份服务区这一端走的是全链数据,只有从备份服务器出来的数据还是去重数据,所以部署在不同点,对链路带宽,通讯的利用率是不一样的。目前是唯一一个,可以把去重的引擎灵活部署在应用端、服务端、目标端的一个厂商。
惠普确实很灵活,我具体选择什么样的技术,具体是采用软件技术还是采用硬件技术,这就取决于我们的应用,我需要高性能的去重,我需要去重过程中对我的应用没有明显的性能影响,我就采用这种应用的去重,如果我要用最小的成本,不需要部署硬件设备,这个可以根据用户的需求灵活来选择。
现在我们讲到是一个跨企业整体的备份,你要部署一个统一的管理平台,这个管理平台通过DP就可以做到,通过DP软件,来做到跨企业范围内所有的数据保护,通过DP就可以统一管理。
目前我们可以根据应用的需求,对于IPO和IPO要求非常高的场景,我们可以通过零停机的备份和立即恢复,备份软件要跟存储配合,备份管理软件和存储系统的功能,存储系统主要是快照和克隆,需要配合在一起使用。目前可以支持HP 3PAR,还有P9500,我们可以支持这种不停机备份和快速恢复,通过DP的管理界面,它是一个图形的界面,我要实现数据的快速备份。
读过这篇文章的人还读过:
4006199527