上云无忧 > 文档中心 > 腾讯云云服务器CVM - 维修任务类型与处理策略
云服务器CVM
腾讯云云服务器CVM - 维修任务类型与处理策略

文档简介:
当平台监控到影响实例可用性及运行性能的异常情况时(例如底层宿主机突发异常宕机,或主动预测底层宿主机的软硬件故障隐患以提前规避宕机风险),平台将立即发起维护流程、记录对应的维修任务,并向用户推送受影响实例的故障或隐患通知。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠
当平台监控到影响实例可用性及运行性能的异常情况时(例如底层宿主机突发异常宕机,或主动预测底层宿主机的软硬件故障隐患以提前规避宕机风险),平台将立即发起维护流程、记录对应的维修任务,并向用户推送受影响实例的故障或隐患通知。您在收到相关通知后,可及时前往 维修任务控制台,查看异常实例的维修时间及处理进度,并授权平台对异常实例进行维护以恢复正常运行状态。
云服务器实例的维修任务按照触发原因进行分类,可分为以下多种类型,每种任务类型的具体含义、应对建议及可选授权策略如下表所示:

维修任务分类

任务类型
任务含义
应对建议
可选授权策略
实例运行异常
实例底层宿主机突发软硬件故障或系统错误,导致实例异常宕机或重启。
当监控到实例运行异常类型的维修任务触发时,平台已在第一时间执行相关维护操作,并尝试对异常实例进行重启以快速恢复实例可用性。
建议您等待实例自动重启完成,并关注维修任务状态更新进展。
根据维修任务的当前状态,判断下一步处理策略:
任务为“处理中”状态时,平台正在紧急对异常实例进行相关维护操作。维护完成后会及时同步更新任务状态,并向您推送相关通知。
任务为“已结束”状态时,异常实例已自动重启完成并恢复运行,您可验证实例和应用是否恢复正常。
实例运行隐患
实例当前运行正常,但监控到实例宿主机或底层平台存在软硬件隐患,可能导致实例性能抖动,或存在异常宕机风险。
为尽快完成维护以规避底层软硬件隐患,避免潜在的宕机风险,建议您提前备份好业务数据,并尽快前往维修任务控制台:
1. (可选)进行实例数据的备份。
2. 授权平台立即发起维护,或提前预约48小时内的计划维护时间。
3. 等待系统在计划维护时间自动发起维护。
根据实例底层隐患的修复方式,可选择以下方式授权处理:
在线迁移授权(实例无需停机,迁移过程中云服务器可能出现短时间高负载或者网络抖动)。
停机维护授权(实例重启快速恢复)。
注意:
1. 如用户超过48小时未授权,系统将在计划维护时间默认发起维护。
2. 本地盘实例暂不支持重启快速恢复,需较长维护周期以修复底层硬件隐患。如有需要,用户可选择重新部署本地盘实例以快速规避隐患(本地盘数据无法保留)。
实例硬盘异常
实例本地硬盘突发故障,可能导致实例 I/O 性能降低或硬盘功能受损。
为尽快完成维护以恢复异常硬盘可用性,建议您提前备份好业务数据,并尽快前往维修任务控制台:
1. (可选)进行实例数据的备份。
2. 授权平台立即更换异常硬盘,或提前预约48小时内的计划维护时间。
3. 等待平台对异常硬盘完成更换,并根据恢复通知中的操作提示,重新挂载并使用更换后的本地硬盘。
根据本地盘实例异常硬盘的修复方式,可选择以下方式授权处理:
在线换盘(实例在线更换异常硬盘,维护过程中异常硬盘短时间内 I/O 暂不可用,处理完成后可根据提示挂载并使用新盘)。
停机换盘(实例需停机更换异常硬盘,有可能保留本地盘数据,但需较长维护周期)。
(可选)弃盘迁移:重新部署本地盘实例,本地盘数据无法保留。分钟级快速恢复实例可用性。
实例硬盘预警
实例本地硬盘存在坏盘隐患或使用寿命即将耗尽,可能导致实例 I/O 异常或磁盘掉线等数据层面异常。
为尽快完成维护以消除本地硬盘潜在的故障风险,建议您提前备份好业务数据,并尽快前往维修任务控制台:
1. (可选)进行实例数据的备份。
2. 授权平台立即更换隐患硬盘,或提前预约48小时内的计划维护时间。
3. 等待平台对异常硬盘完成更换,并根据恢复通知中的操作提示,重新挂载并使用更换后的本地硬盘。
根据本地盘实例异常硬盘的修复方式,可选择以下方式授权处理:
在线换盘(实例在线更换异常硬盘,维护过程中异常硬盘短时间内 I/O 暂不可用,处理完成后可根据提示挂载并使用新盘)。
停机换盘(实例需停机更换异常硬盘,有可能保留本地盘数据,但需较长维护周期)。
(可选)弃盘迁移:重新部署本地盘实例,本地盘数据无法保留。分钟级快速恢复实例可用性。
实例网络连接异常
实例底层网络连接突发故障,可能会引起实例网络抖动或导致网络连接异常。
当监控到实例网络连接异常类型的维修任务触发时,平台已在第一时间对底层网络执行相关维护操作,并尝试恢复异常实例的网络连接可用性。
建议您等待实例网络连接自动修复完成,并关注维修任务状态更新进展。
根据维修任务的当前状态,判断下一步处理策略:
任务为“处理中”状态时,平台正在紧急对异常实例底层网络进行相关维护操作。维护完成后会及时同步更新任务状态,并向您推送相关通知。
任务为“已结束”状态时,异常实例网络连接已恢复正常,您可验证实例和应用是否恢复正常。
实例维护升级
实例因底层宿主机架构、软件升级等原因需要发起在线维护,以提升实例性能及安全性。
为尽快完成维护以提升实例性能及安全性,建议您提前备份好业务数据,并尽快前往维修任务控制台:
1. (可选)进行实例数据的备份。
2. 授权平台立即发起维护,或提前预约48小时内的计划维护时间。
3. 等待系统在计划维护时间自动发起维护。
可选择以下授权方式:
在线维护(实例无需停机,维护过程中云服务器可能出现短时间高负载或者网络抖动)。
注意:
如用户超过48小时未授权,系统将在计划维护时间默认发起维护。

任务状态

任务状态
含义
待授权
等待用户授权,用户可选择授权维护方式和维护时间。非硬盘类维修任务如超过48小时用户仍未授权,则系统将在计划维护时间默认发起维护,并将维修任务转为处理中状态。
已预约
用户已操作授权,并预约维护时间。在任务创建的48小时之内,可修改系统默认的计划维护时间。
处理中
维修任务正在执行中。
已结束
维修任务已处理完成。
已避免
当实例存在未结束的维修任务时,用户对实例进行退还、销毁、调整配置等操作时,将中断避免本次维修任务流程。
已取消
本次维修任务已被系统取消。
相似文档
  • 操作场景: 本文介绍如何通过腾讯云控制台,查看待处理与历史维修任务列表,及其详细的故障处理情况。 操作步骤: 1. 登录云服务器控制台,选择左侧导航栏中的维修任务 > 任务列表。 2. 在维修任务列表页面,您可在列表上方选择筛选条件,获取所需维修任务列表。如下图所示:
  • 操作场景: 本文介绍如何通过腾讯云控制台,针对维修任务选择一个具体的维护策略,并预约维护处理时间。 操作步骤: 1. 登录云服务器控制台,选择左侧导航栏中的维修任务 > 任务列表。 2. 单击维修任务所在行右侧的授权/预约。如下图所示:
  • 操作场景: 您可以对某个标签下所有的云服务器实例设置预置维护授权策略。当维护任务产生时,将按已配置的预设策略进行处理,无需再单独操作授权。本文介绍如何通过云服务器控制台,设置预置维护授权策略。
  • 操作场景: 您可以对云服务器实例对应的维修任务设置告警,在发生异常时将会第一时间通过微信、邮件、短信、电话等渠道通知您采取措施。本文介绍如何通过事件总线控制台,通过 事件总线 设置云服务器实例对应事件告警。
  • 操作场景: 云硬盘是云上可扩展的存储设备,用户可以在创建云硬盘后随时扩展其大小,以增加存储空间,同时不失去云硬盘上原有的数据。 云硬盘扩容完成后,需扩展分区及文件系统。您可将扩容部分的容量划分至已有分区内,或者将扩容部分的容量格式化成独立的新分区。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部