您现在的位置是:免费论文网 >>免费论文范文

浅谈IT服务的可用性设计方法_计算机应用论文

免费论文网22人已围观

简介摘要:2011年新版ISO/IEC20000的发布,为IT服务管理的实施提供了参照标准。本文根据ISO/IEC20000:2011版中的IT服务可用性要求,提出面向客户服务级别

摘要:2011年新版ISO/IEC20000的发布  ,为IT服务管理的实施提供了参照标准 。本文根据ISO/IEC 20000:2011版中的IT服务可用性要求  ,提出面向客户服务级别需求设计和实现IT服务的可用性  ,并指出可用性设计是实现高质量IT服务的有效途径  。
  关键词:IT服务;IT服务管理;可用性;可用性设计
  中图分类号:TP311.52 文献标识码:A文章编号:1007-9599 (2011) 20-0000-02
  Availability Design Ways of IT Services
  Kong Xianglin
  (CEPREI Certification Center,Guangzhou510610,China)
  Abstract:In 2011,the release of new version of ISO/IEC20000,the implementation of IT service management provides a reference standard.Based on ISO/IEC 20000:2011 version of the IT service availability requirements,customer service level requirements for the proposed design and implementation of IT service availability,and that the availability of high quality IT services designed to achieve an effective way.
  Keywords:IT services;IT service management;Availability;
  Availability design
  一、可用性基本概念
  可用性是IT服务领域内实现服务交付的最为重要的方面之一  ,能否确保服务可用性不仅会对客户满意度产生重大影响  ,而且还将影响到企业整体形象和经营成败 。可用性管理既要确保对服务质量构成影响的事件不会发生  ,又要确保在意外事件发生的情况下采取及时有效的补救措施  。
  IT服务的可用性概念包括服务可用性、可靠性、可维护性和可服务性[1] 。
  可用性指在特定的时间内执行某项功能的能力  。高可用性意味着服务对客户是持续可用的  ,宕机时间少并且服务可迅速恢复  。如主机每月正常工作时间是98%  ,服务的可用性取决于下列因素:(1)IT基础架构的复杂程度;(2)IT服务组件的可靠性;(3)对故障做出快速有效反应的能力;(4)IT支持部门或供应商提供的维护的质量;(5)运营级管理流程的质量和范围 。
  可靠性指在约定的时间内  ,服务未发生中断和故障的持续可用能力  。如由于硬件的故障  ,主机每个月出现两次事件  。服务的可靠性取决于下列因素:(1)IT服务组件的可靠性;(2)组件的弹性  ,表现为组件发生故障后还能持续提供服务的能力;(3)能够预防服务中断的高质量的维护工作  。
  可维护性和可恢复性指IT服务或者组件能够维护或者恢复到正常状态的容易程度  ,可维护性表现为预防性和修复性  ,主要包括预防性维护和计划性审查  。如每星期五进行数据库备份 。服务的可维护性和可恢复性取决于下列因素:(1)采取措施预防故障的发生的有效性;(2)组件故障检测的能力;(3)故障诊断和解决速度;(4)故障发生后尽快恢复的水平;(5)服务恢复的速度 。
  可服务性指外部IT服务提供商履行合同义务的满足程度  ,与外部服务提供商的合同契约有关  ,该合同定义了需要为外包服务提供的支持  ,如每年要留出两天给供应商更新软件  。如果承包方承担服务的所有责任  ,则可服务型与可用性表示同一含义  。
  IT服务的可用性管理重点围绕两个不同领域展开  ,第一个领域是明确客户服务需求 ,定义与设计新增IT服务的可用性  ,第二个领域则是在现有IT服务的基础商提高可用性水平  。这两个领域都需要应用服务可用性的设计方法  。
  二、可用性设计
  可用性设计方法包括IT服务可用性需求分析、可用性识别与评价和可用性计划三部分 。
  (一)可用性需求分析
  在签订服务级别协议之前  ,必须识别、分析和定义IT服务的可用性需求  ,以确定是否能够满足这些需求以及怎样满足这些需求  。可用性需求分析的内容包括:(1)服务的范围及其定义;(2)服务对所在机构的重要性;(3)服务所支持的用户数量;(4)服务不可用状态造成的业务影响程度;(5)服务不可用状态产生的成本代价以及成本代价随时间推移相应变化的趋势;(6)服务提供的可用时间;(7)服务提供的关键时段 ,如业务的高峰、月末及处理期限等;(8)服务提供次要时段  ,如较容易承受停机故障的时间;(9)服务计划中断时段  ,如专为计划内维护与系统升级工作设定的停机时间;(10)服务容许的不可用时间:如启动应急计划之前所能容许的故障停机时间 。
  根据以上可用性需求分析的结果  ,可以对IT服务的可用性需求进行分类  ,分类的标准见可用性分类表(表1[2]):
  可用性分类可用性级别每年服务中断时间
  持续性100%0分钟
  容错性99.999%5分钟
  弹性(冗余)99.99%53分钟
  高可用性99.9%8.8小时
  一般可用性99-99.5%87.6-43.8小时
  表1:可用性分类表
  (二)服务组件可用性的识别和风险评价
  1.服务组件的可用性识别
  在可用性设计过程的初始阶段  ,可以把整体服务对象拆分为若干服务组件并依次进行可用性满足程度的识别  。通常将构成并支持某项IT服务的整个基础架构拆分为下列IT领域  ,如应用系统、中间件、操作系统、硬件、网络、配套设施、出口设施等  。每种IT组件的完整生命周期都将在实现最高服务可用性水平这一原则的指导下得到缜密考虑  。每种IT组件的可用性、可靠性、可维护性和可服务性都将从可用性风险与对策和组件生命周期管理需求两个主要方面接受详细考核与缜密考虑  ,组件可用性识别考虑的因素包括:(1)应用系统、中间件和操作系统方面 ,包括单点故障、不当配置选项、设计缺陷、低效的开发方法、代码编写错误等;(2)硬件和网络方面  ,包括单点故障、过时的固件、不当的文档维护、厂商支持水平不够、缺乏抗静电防范措施、缺乏后备资源、线缆连接标识混乱等;(3)配套设施方面  ,包括空调能力不足、电源中断、电源不稳定、火灾与洪水、物理安全疏漏等;(4)出口设施方面  ,包括单一供电线路和单一电信线路;(5)人员方面  ,包括低劣的质量控制规程、缺乏纪律约束、缺乏专业技能等  。
  2.服务可用性风险评价
  通过识别引起组件可用性降低的薄弱环节 ,找出引起服务可用性质量下降的所有因素和隐患  ,结合风险评估方法 ,按照各种可用性风险发生的可能性和风险发生的严重程度进行综合排序  ,并找出需要优先处理的可用性风险  。并把风险纳入在可用性管理的补救范围内加以关注  ,下一步就是设计出合适的解决方案 ,尽量减小该可用性风险为IT服务所带来的影响和损失  。
  (三)服务可用性设计
  服务可用性设计是提高服务质量的关键环节  ,首先根据客户服务的可用性需求制定可用性的实现目标  ,并以可量化的数据表述 。然后依据可用性目标和可用性风险的识别和评价结果  ,制定出实现IT服务组件的检查、维护和恢复方案  。
  1.服务组件健康检查
  高质量的服务意味着尽可能少的或没有发生服务中断  ,如果能够通过可靠的工具和方法及时地检测、监控和发现问题  ,将有效的缩小服务中断时间  。服务健康检查正是发现可用性风险及隐患的有利方法 ,检查方案的内容包括:(1)可靠和快速检测的工具及方法;(2)服务运行状态的监控;(3)服务组件健康状况的可检测能力;(4)系统性能检测、运行分析和评价的结果  。
  2.服务组件维护
  通常  ,在服务运作中安排了计划内维护与升级工作设定的停机时段 ,即维护窗口期 。这些窗口期可用于采取一些预防行动  ,如软件和硬件的升级 。计划性维护的方法包括:(1)服务的启动和关机;(2)密码维护方法;(3)服务的可用替代方法;(4)组件的备份与恢复方法;(5)服务中断的应急修补方法;(6)服务组件的升级与修订方法;(7)常规性服务及管理任务  。
  3.服务组件恢复
  对服务组件而言  ,无论日常的检查和维护多么完美 ,在服务交付过程中  ,仍可能发生IT服务中断  。对于一个造成服务中断的可用性风险  ,如果故障发生会为客户带来昂贵的成本  ,那么 ,快速恢复可能是其最佳的设计选择  。设计恢复方案需要考虑的因素包括:(1)运用联机配置并保持运行的机会  ,如双机运行机制;(2)故障转移与故障恢复的能力;(3)组件故障快速诊断的技能;(4)事件生成与处理的需求;(5)事件处理流程;(6)所需配置文档;(7)最新厂商文档  。
  任何一个事件的恢复过程都会经历事件的启动、监测、诊断、修理和恢复过程 。由于IT服务的可用性和事件可看成一个整体 ,在每个过程中所花费的时间都会影响到整个服务中断时间  。因此  ,恢复方案应充分考虑并整合有效处理IT设施故障的最佳方法 。
  4.服务可用性评估
  服务可用性设计的检查、维护和恢复方案实际上对实现高可用性服务级别还远远不够  。一个较好的可用性设计方案不但具有及时发现和处理影响可用性的有关风险及事件  ,还应该通过建立可用性模型  ,通过定期分析和评估来实现可用性的主动管理  。
  建立可用性模型  ,可根据丰富的IT服务经验、专业知识和对IT基础架构的可靠性、可维护性的相关数据建立可用性模型  。可用性模型应充分考虑到服务组件、服务环境、人为因素、管理体系等影响可用性的因素 ,把这些因素按照可靠性、可维护性、可服务性进行排序 ,并划分为三个级别组合得出高级、中级和低级的可用性模型 。
  定期分析和评估 ,定期分析和评估对于确保IT服务的正常运营至关重要  。通过和客户员工交流和收集活动数据  ,并依照可用性模型进行对照评估和差距审查  ,编写出详细的差距分析报告  ,对存在的差距提出服务改进计划  ,并改进之前设计的可用性解决方案  。此外  ,根据企业所需的可用性服务级别  ,借助可用性模型可找出企业运营中存在的风险  。可用性评估还可以找出其中存在的主要缺陷 ,并提供相关建议调整IT服务供应商的主要组成部分  ,包括流程、人员、技术基础设施和支持合作伙伴等  ,以促进服务改进计划的实施  。
  三、总结
  毫无疑问  ,随着ISO/IEC 20000的应用和IT服务管理理念的推广 ,IT服务可用性越来越为客户所重视  ,客户对IT服务可用性服务级别的要求越来越高  ,作为IT服务供应商需要深入分析客户服务需求  ,从客户可用性服务级别的要求出发  ,借助可用性的设计方法实现高质量的IT服务  。
  参考文献:
  [1]Jan van Bon,章斌.基于ITIL的IT服务管理基础篇[M].清华大学出版社,2007
  [2]Hank Marquis.The Paradox of the 9s.www.itsmsolutions.com,2006

       

Tags: 免费论文   计算机论文   计算机应用论文   可用性   组件   故障  

相关文章

(function(){ var src = (document.location.protocol == "http:") ? "http://js.passport.qihucdn.com/11.0.1.js?1d7dde81dc0903e04d3ac0b9599444f6":"https://jspassport.ssl.qhimg.com/11.0.1.js?1d7dde81dc0903e04d3ac0b9599444f6"; document.write('<\/mip-script>'); })(); (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();