1.概述
操作系统平台的运维质量,是整个业务系统可靠、稳定运行的关键。操作系统平台的运维,涉及到系统部署、故障处理、变更处理、架构优化、系统优化、系统检查等多方面的事务。为了保障行业客户业务的可靠运行,促进业务系统的高服务能力,RedHat为行业客户(如金融、能源等)量身提供完整的一套产品支持、运维服务以及培训服务的解决方案。
行业客户对IT稳定性要求很高,我们建议用户除了每年购买RHEL的订阅服务之外,购买一定量的紧急现场服务支持,以便应对紧急问题现场支持或业务割接、升级现场驻守等。
红帽的认证培训体系非常完备,涵盖红帽所有产品。由于红帽认证考试均为上机实操性质,因此其含金量很高,从技术投资回报率开看,红帽认证ROI在IT圈内名列前茅。因此,对于行业用户,每年通过认证培训,不仅有助于提高运维团队在Linux、开源方面解决方案的技能,有助于提高技术团队的士气。
简而言之,针对行业用户,每年在制定IT预算的时候,涉及红帽解决方案,可以将RHEL订阅 + 现场服务 + 培训服务三者一并考虑。以保证您的IT业务安全、稳健地运行的同时,大幅提升自身IT团队的技术实力。
2.Red Hat产品和运维服务方案
2.1 服务组成
本产品和运维服务解决方案共包含4大组成部分,如下图所示:
其中,产品升级和支持以及现场运维支持服务为提供的主要服务内容,产品升级和支持需要依赖于红帽产品订阅服务来提供,而现场运维支持服务则以人天来计算。现场运维支持服务又分为红帽专家服务和红帽高级专家服务。
本次提供的产品订阅均提供7*24小时的高级订阅服务。
2.2 用户服务接口
为了更好的对行业用户提供服务相应,红帽提供多多种联系通道,行业用户可以根据实际情况选择最顺畅的通道与红帽进行沟通。
用户服务接口如下图所示:
用户可以直接访问access.redhat.com进入用户门户,在用户门户中查看文档、进行软件升级、下载软件、提出问题、进行Case管理等工作。也可以通过拨打红帽服务电话800-810-2100转2与红帽CEE(电子支持团队)进行沟通。当遇到紧急事件时,用户可以直接拔打现场技术专家电话。
本项目为行业用户提供项目协调人,用户也可以通过项目协调人协调各种服务资源。
红帽门户和电话支持联系方式如下:
2.3 服务流程
基于4个用户服务接口,行业用户的服务流程如下图所示:
3 Red Hat服务内容
3.1产品升级和远程支持服务
3.1.1 服务方案
产品升级和远程支持通过红帽的订阅服务来提供,本方案按照货物列表中的需求提供对应的红帽原厂订阅支持服务:
在订阅服务中,行业用户主要能够得到的服务有:
(1)提供7*24小时的电子化服务支持,对常见问题进行快速响应并解答,服务方式包括Web、800电话等电子服务方式。针对系统崩溃、无法启动或拒绝连接等原因导致系统无法运行的故障,提供1小时内的响应能力。
(2)提供access.redhat.com客户门户,行业用户相关人员能够登录门户进行技术文档的查询、软件下载、问题追踪等工作。
(3)通过access.redhat.com管理已经注册的系统,并进行在线的软件更新,也可以直接下载最新的软件包,进行离线更新。
3.1.2 红帽订阅服务介绍
1)简介
红帽在中国具有产品支持中心,称为CEE,通过CEE,Red Hat能够通过Web、800电话为用户提供快捷、专业的技术服务。
目前中国CEE服务中心具有服务人员38人,并且在内核、存储、高可用等领域均有相应的领域专家,用户服务电话将有工程师直接接听,具有极高的服务响应速度和效果。
2) 红帽客户服务门户
用户购买红帽订阅服务后,将会获得一个红帽账号,通过该账号,用户能够登录红帽客户门户(access.redhat.com)对订阅服务和注册系统进行管理。
红帽客户门户的注册及服务流程如下图所示:
在access.redhat.com中,用户能够详细的看到目前的订阅数量,订阅类型以及服务时间,并进行多种管理。
下图是在订阅信息查看示例:
3)事故级别及响应时间
红帽全球支持服务使用以下定义的严重性级别对问题进行分类:
严重级别 1(紧急)
严重影响到生产环境正常运行的软件使用问题(如生产数据丢失或生产系统不能正常运行)。这种情况造成您的业务运作暂停,并且不存在其他临时的问题解决方案。
严重级别 2(高)
软件可以正常运行,但在生产环境中的使用被严重削弱的问题。这种情况对您的业务运作有较大的影响,并且不存在其他临时的问题解决方案。
严重级别 3(中)
涉及生产环境或开发环境中部分的、非关键性的软件使用问题。在生产环境中,对您的业务有中低级影响,但是业务仍可正常运作(包括使用其他临时解决方案使业务可以正常运行)。对于开发环境,这种情况使您的项目无法再继续或无法迁移至生产环境。
严重级别 4(低)
一般使用问题,包括报告文档中的错误,或对未来的产品提出增强或修改建议。在生产环境中,对您的业务或系统的性能和功能影响较低或没有影响。在开发环境中,对您的业务有中低级影响,但是业务仍可正常运作(包括使用其他临时解决方案使业务可以正常运行)。
4)服务等级协议
根据用户所购买的订阅类型,以及用户所提交的问题的严重级别,红帽CEE根据如下服务等级协议对用户的问题作出响应:
标准服务 (Standard) | 金牌服务(Premium) | ||
响应时段 | 标准工作时间 | 标准工作时间(针对严重级别为1和2的问题提供24x7支持) | |
支持方式 | Web和电话 | Web和电话 | |
问题数量 | 不限 | 不限 | |
响应时间 | 首次响应时间和后续响应时间 | 首次响应时间 | 后续响应时间 |
严重级别 1 | 一个工作时 | 一小时 | 一小时或约定的时间 |
严重级别 2 | 四个工作时 | 两小时 | 四小时或约定的时间 |
严重级别 3 | 一个工作日 | 四个工作时 | 八个工作时或约定的时间 |
严重级别 4 | 两个工作日 | 八个工作时 | 两个工作日或约定的时间 |
5)产品支持范围
红帽对产品支持的范围做出了明确规定。对于红帽产品,CEE提供如下支持:
1.安装
2.使用
3.配置
4.故障诊断
5.Bug提交(参照产品生命周期)
6.Bug修复
此支持范围适用于所有当前及以往的发行版。红帽产品包括红帽企业版Linux,层次型产品(GFS,集群套件等),MRG,Cloud和JBoss 企业级中间件。
CEE不支持的范围有:
修改过的RPM包
代码开发
系统和网络设计
安全规则和政策的开发和实施
红帽的附加频道(更多内容)
可选的仓库和频道(更多内容)
技术预览功能(更多内容)
为了满足依赖关系而包含的软件包,或者在部署独立系统时附带包含的软件包
6)技术支持流程
在用户提交问题之前,用户可以登录客户门户网站(access.redhat.com),通过查找知识库文章、白皮书、视频资料或者其他的文档,自行解决技术问题。
另外,用户可以通过电话或者客户门户网站提交技术问题。
技术支持工程师接到用户的问题时,将通过内部查询支持库。如果用户提交的问题是一个已知的问题,技术支持工程师将和用户分享已经存在的解决方案。
如果用户提交的是一个新的问题,或者现有的解决方案不能全部解决用户的问题,问题将被分配到正确的SBR域。域内的某一个工程师将负责解决用户的问题。如果需要,他/她将会协同其他工程师一起分析用户的问题。
在必要的时候,Virtual Account Team(VAT)将会参与进来,一起协调解决用户的问题。VAT是用户所对应的红帽的各部门的人员组成,包括客户成功经理(CSM)、大客户技术客户经理(Technical Account Manager,TAM)、销售代表(Sales)、售前工程师(Solution Architect,SA)以及技术顾问(GPS,Consulting)。
最后,工程师给用户提供正确的解决方案,并且将解决方案记录在知识库中,以便其他工程师和客户使用。
7)人性化的订阅客户访问页面
红帽订阅客户可以登录https://access.redhat.com/dashboard/网站,查看目前自己已经提过的问题单、问题单分类,并给出技术建议。
8)主动式服务:
针对红帽订阅式服务,CEE主动联系用户、告知风险,并给出技术建议:
3.2现场运维支持服务
3.2.1服务方案
本方案按照货物列表中的需求为行业用户提供红帽技术专家现场维护支持服务。
3.2.2 红帽现场运维支持服务介绍
红帽向行业用户提供的支持服务内容将涵盖:
(1)技术支持
系统问题诊断;
跟踪问题日志,状态回顾;
故障排除;
基于行业用户项目需要,给第三方厂商提供支持;
参加项目的部署架构和维护方案讨论。
(2) 业务战略和产品部署支持
参与行业用户的业务规划过程和审核会,并结合行业用户的IT战略对红帽企业Linux和开源软件的方向给出建议;
记录行业用户的需求并全局性地提供Linux部署战略建议;
通过专题会,为行业用户的IT经理传递红帽企业Linux和开源产品的产品路线图。
(3) 核心构建实施服务
评估基础设施计划和安全策略;
评估被部署的硬件和软件的认证;
为核心构建选择适当的软件包;
基于红帽的Kickstart应答机制实现核心构建的基础设施;
提供完全的搭建文档;
在服务期间,为行业用户的IT人员提供全面的知识传授。
(4) 健康巡检服务
磁盘空间检查;
系统健康检查;
系统活动日志检查;
操作系统安全扫描;
检查自动化的脚本,做到更加自动化;
检查和应用操作系统更新(如果需要);
CRON工作调度;
检查日志滚动流程;
调度资源监控脚本;
通过调度脚本自动执行日常的任务。
(5) 系统调优服务
通过现场查看系统运营状况,优化系统,确保应用运行在一个优化的环境;
了解应用程序,环境和目标,确定性能调优的范围,讨论优化方法;
根据红帽的最佳实践,深入检查与性能和安全相关的所有配置;
与行业用户信息中心一起进行测试,分析结果和进行适当的优化;
为行业用户项目提供实施文档和知识传授。
一个完整的红帽现场支持服务标准流程图下图所示:
现场服务输出物案例1:标准化
现场服务输出物案例2:安全加固
3.3红帽服务质量保障计划
经过多年的发展和总结,红帽CEE已经具备了完善的服务质量控制体系。
1)技术及综合能力保障
首先,红帽CEE对于技术支持工程师的技术能力有严格的要求。所有技术支持工程师都必须持有RHCE(Red Hat Certified Engineer)或者JBCAA(JBoss Certified ApplicationAdministrator)证书。同时,CEE要求员工不断提高自身的技术能力,接受RHCA课程培训,提高团队的整体技术水平。此外,在CEE员工在职期间,CEE部门会协同红帽大学(Red Hat University)部门安排相应的培训。培训课程涵盖综合素质、协调沟通能力等各个方面,旨在提高支持团队的综合素质。此外,CEE支持质量分析专员(Supp ort Quality Analyst, SQA)会协助技术支持工程师回顾某些技术问题的处理过程,并且给技术支持工程师提供专业性的指导。
2)知识共享(Knowledge Centered SupportMethodology,KCS Methodology)
KCS (Knowledge-Centered Support) 是CEE的知识共享流程,是知识库的创建(Creation)、共享(Sharing)、重复使用(Re-use)和不断优化(Improvement)的过程。技术支持