搜索

容错计算技术

gecimao 发表于 2019-04-13 15:25 | 查看: | 回复:

  所谓灾备或灾难备份,就是要利用技术、管理以及相关资源,确保关键数据、关键业务等,在灾难发生后可以迅速恢复。其目的,就是要确保关键业务持续运行,就是要减少非计划宕机时间。

  本章介绍的灾备,又称为容灾,它涵盖了容错领域、存储领域和信息安全领域等,其重点是灾难前的备份与灾难后的恢复。这里灾难前的备份,并不仅仅包含通常的数据备份和日志管理,更重要的是还包括信息系统构建时的“容灾系统设计”和“灾难应急预案”等。此时必须做到“设计周全、防患未然”,还要充分考虑“灾备与开销之间的平衡”,这里的“开销”包括软、硬件开销等,这里的“灾备”也要尽可能保护系统资源,包括数据信息、业务系统、应用服务等资源。灾难后的恢复,则包括了应急服务、备份系统的业务接管、数据/系统/服务的迁移、灾难评估等。此时要以“降低损失、恢复服务”为目标,以“评估损失和保障业务”为重点。

  为应对各种可能的灾害,信息系统灾备必然会涉及到许多相关技术,特别是容错计算技术、信息安全技术、系统管理技术、存储技术、灾备体系结构等。下面分别简要介绍这些技术。

  容错计算技术:这是灾备的核心技术。所谓容错,就是“容忍错误”或“带病工作”,即允许系统在出现某些特定硬件或软件故障时,仍能提供预定的服务;或从灾备角度看,可更具体地说,容错就是当系统出现数据、文件损坏或丢失时,系统能自动恢复到事故前的状态,并连续提供正常服务。容错技术,本质上就是冗余及管理、故障检测与诊断、系统状态维护与恢复等。从故障处理方式上看,容错又可分为:故障检测技术、故障屏蔽技术和动态冗余技术。

  其中,故障检测技术,意在发现故障、定位故障。衡量检测技术的主要指标是检测覆盖率,即任意故障被检测到的概率。检测也包含诊断,而衡量诊断技术的指标是诊断分辨率,即故障定位的精确度。

  故障屏蔽技术,其基本思想是:利用多个部件或系统,以固定的结构和运行方式,同时执行相同的功能;利用多个一致的结果,来屏蔽某些故障。不过,屏蔽只能用于应急,因为它受制于预先的静态配置,当故障积累到使屏蔽能力饱和时,屏蔽功能就会失效。比如,突然停电后,便可立即启动蓄电池,但由于蓄电池的持续时间有限,所以必须尽快修复交流电源。

  动态冗余技术,它通过多模式的冗余(包括信息冗余、结构冗余、时间冗余和空间冗余等),为信息系统抵御灾难提供基础。动态冗余技术是借助快速响应的故障检测与诊断技术,来提高系统的可靠性,缩短故障的修复时间,增强系统的可用性。动态冗余技术可及时自动切换故障子系统或改变系统结构,阻止故障积累。动态冗余技术可以说是容错计算技术中最主要、最常用和最复杂的技术。

  上述检测、屏蔽和冗余三项技术,其实是相辅相成的:检测发现并定位故障后,屏蔽就赶紧出来应急,最后冗余“以新换旧”,彻底解决问题。

  从形式上看,容错计算技术,可分为硬件容错和软件容错。硬件容错就是以冗余的硬件来应对灾难。为使硬件容错得以实施,在信息系统设计时,就必须像“乐高”玩具那样,采用硬件模块化思路以增强系统的可扩充性和可维护性。当故障发生后,冗余的硬件便可立即挺身而出保障系统继续工作,而无需中断服务。硬件容错的缺点是成本较高。软件容错就是以冗余的软件来应对灾难。其优点是不依赖硬件,且灵活性和可移植性都较好,缺点是速度较慢。

  当然,在实际使用时,既不会只用硬件容错,也不会只用软件容错,而是将它们搭配使用,取长补短,整体上实现性能和效益最大化。

本文链接:http://jonnutting.com/dongtairongyu/54.html
随机为您推荐歌词
推荐文章

联系我们 | 关于我们 | 网友投稿 | 版权声明 | 广告服务 | 站点统计 | 网站地图

版权声明:本站资源均来自互联网,如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

Copyright @ 2012-2013 织梦猫 版权所有  Powered by Dedecms 5.7
渝ICP备10013703号  

回顶部