上云无忧 > 文档中心 > 百度智能云云监控云产品事件列表
百度智能云云监控云产品事件列表

文档简介:
云监控事件监控当前支持以下事件信息: 弹性裸金属服务器 BBC: 硬盘出现故障扇区,Hard disk has failed sectors, WARNING, 您的BBC实例${InstanceName}检测发现故障扇区。该信息可能由数据、标志信息、校验码、地址信息等故障导致,建议您保持关注。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

云监控事件监控当前支持以下事件信息:

弹性裸金属服务器 BBC

事件中文别名 事件英文别名 事件级别 处理方法与建议
硬盘出现故障扇区 Hard disk has failed sectors WARNING 您的BBC实例${InstanceName}检测发现故障扇区。该信息可能由数据、标志信息、校验码、地址信息等故障导致,建议您保持关注。
硬件故障事件 Hardware failure event NOTICE 您的BBC实例${InstanceName}出现硬件故障事件,建议您对实例保持关注,如果出现严重问题,您可以在维修平台上查看到对应的事件。
维修平台事件 Maintenance platform event NOTICE 您的BBC实例${InstanceName}出现维修平台事件,您可以前往维修平台查看具体问题。
CPU出现Cache读写错误 Cache read and write error occurred in the CPU WARNING 您的BBC实例${InstanceName}出现CPU Cache读写错误。如果实例没有宕机,建议您保持关注;如果实例已经无法正常运行,请及时提交工单进行CPU更换。
内存CE错误 Memory CE error WARNING 您的BBC实例${InstanceName}出现一般故障,建议您保持关注,如果后续仍然频繁出现类似告警,请您通过工单与百度智能云后台联系。
内存CE错误风暴 Memory CE error storm CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
内存UE错误 Memory UE error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘处于DStatus The hard disk is in DStatus CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
漂盘 Drift WARNING 您的BBC实例${InstanceName}出现漂盘,建议您确定业务无影响后进行重启查看问题是否解决。
GPU出现总线故障带宽下降 GPU bus failure and bandwidth drop CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
GPU自身内存出现故障 GPU memory failure CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
GPU温度过高 GPU temperature is too high CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
GPU掉卡 GPU dropped CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘出现磁头或电路错误 The hard disk has a head or circuit error CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘出现IO错误 Hard disk IO error WARNING -
硬盘出现介质错误 Hard drive has a media error CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘掉盘 Hard drive CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
网卡不通 Network card is not working WARNING 您的BBC实例${InstanceName}出现故障,您可以尝试重启,如果仍然出现问题请通过工单联系百度智能云后台进行处理。
网卡降速 Network card slowdown WARNING 您的BBC实例${InstanceName}出现故障,您可以尝试重启,如果仍然出现问题请通过工单联系百度智能云后台进行处理。
硬盘处于NotReady状态 The hard disk is in NotReady state WARNING 您的BBC实例${InstanceName}出现故障,您可以尝试重启,如果仍然出现问题请通过工单联系百度智能云后台进行处理。
NVME出现控制器报错 NVME has a controller error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
NVME处于DStatus状态 NVME is in DStatus state WARNING 您的BBC实例${InstanceName}出现故障,您可以尝试重启,如果仍然出现问题请通过工单联系百度智能云后台进行处理。
NVME出现介质异常错误 NVME has a media exception error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
NVME掉盘 NVME drop CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
NVME无法读取SMART信息 NVME cannot read SMART information WARNING 您的BBC实例${InstanceName}出现故障,您可以尝试重启,如果仍然出现问题请通过工单联系百度智能云后台进行处理。
NVME擦写次数耗尽 NVME erase and write times exhausted CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
恢复健康 Regain health NOTICE 您的BBC实例${InstanceName}已经恢复正常运行状态。
RAID卡BBU故障 RAID card BBU failure CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘Failed Physical Disk Failed CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘介质错误次数超限 The number of physical disk media errors exceeds the limit CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘Missing Physical Disk Missing CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘Offline Physical Disk Offline CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘其它错误次数超限 The number of other physical disk errors exceeds the limit CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘预测错误次数超限 The number of physical disk prediction errors exceeds the limit CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘UnconfigedBad Physical Disk UnconfigedBad CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘UnconfigedGood Physical Disk UnconfigedGood WARNING 您的BBC实例${InstanceName}处于Offline状态,未能成功假如阵列,您可以通过工单与百度智能云后台联系进行逻辑阵列的重建。
物理盘寿命耗尽 Physical disk life is exhausted CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
RAID卡功耗节省设置异常 RAID card power saving settings are abnormal WARNING 您的BBC实例${InstanceName}出现故障,如果您对实例的性能要求较高,请在迁移实例服务后,通过工单联系百度智能云后台进行RAID卡的功耗模式设置。
逻辑盘有物理盘损坏导致降级 Logical disk is damaged due to physical disk degradation CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
RAID卡BBU缓存设置异常 The RAID card BBU cache setting is abnormal WARNING 您的BBC实例${InstanceName}出现故障,请通过工单联系百度智能云后台进行硬件报修。
逻辑盘NotReady Logical Disk NotReady CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
逻辑盘读缓存设置异常 Logical disk read cache setting is abnormal WARNING 您的BBC实例${InstanceName}出现故障,如果您对实例的性能要求较高,请在迁移实例服务后,通过工单联系百度智能云后台进行逻辑盘缓存设置。
逻辑盘卡写缓存设置异常 Logical disk card write cache setting is abnormal WARNING 您的BBC实例${InstanceName}出现故障,如果您对实例的性能要求较高,请在迁移实例服务后,通过工单联系百度智能云后台进行逻辑盘卡的缓存设置。
总线可纠正错误 Bus correctable errors CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
总线关键错误 Bus critical error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
总线关键错误 Bus critical error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
配置错误 Configuration error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
CPU配置错误 CPU configuration error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
可纠正ECC内存错误 Correctable memory error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
可纠正错误达到门限 RepairCorrectableECClogginglimitreached CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
可纠正的硬检错误 Correctable hard check error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
可纠正错误达到门限 Correctable error reached threshold CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
设备不在位 Device not in place CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
设备错误 Device error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
内存CE RepairDIMMCE CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
内存CE错误风暴 Memory CE error storm CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
宕机预警 Downtime warning CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
内存UE错误 Memory UE error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘处于DStatus The hard disk is in DStatus CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
电源故障 electricity failure CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘预警 Hard disk warning CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
CPU内部错误 CPU internal error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
故障恢复引导错误L2 Failure recovery boot error L2 CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
GPU 出现总线故障,带宽下降 GPU bus failure, bandwidth drop CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
GPU 自身内存出现故障 GPU memory failure CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
GPU 温度过高 GPU temperature is too high CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
GPU 掉卡 GPU dropped CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘出现磁头或电路错误 The hard disk has a head or circuit error CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
CPU内部错误 CPU internal error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
RAID阵列错误 RAID array error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
RAID阵列降级 RAID array degradation CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
安装失败 installation failed CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
安装错误 Installation error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
内存清理失败 Memory cleanup failed CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘掉盘 Hard drive CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
NVME出现控制器报错 NVME has a controller error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
NVME 出现介质异常错误 NVME encountered a media exception error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
NVME掉盘 NVME drop CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
NVME 擦写次数耗尽 NVME erase cycles exhausted CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
奇偶校验错误 Parity error CRITICAL
PCI奇偶校验错误 PCI parity error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
PCI系统错误 PCI system error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
检测到电源故障 Power failure detected CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
预先告警 Early warning CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
RAID卡BBU故障 RAID card BBU failure CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘 Failed Physical Disk Failed CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘介质错误次数超限 The number of physical disk media errors exceeds the limit CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘 Missing Physical Disk Missing CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘 Offline Physical Disk Offline CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘其它错误次数超限 The number of other physical disk errors exceeds the limit CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘预测错误次数超限 The number of physical disk prediction errors exceeds the limit CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘 UnconfigedBad Physical Disk UnconfigedBad CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
物理盘寿命耗尽 Physical disk life is exhausted CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
逻辑盘有物理盘损坏导致降级 Logical disk is damaged due to physical disk degradation CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
逻辑盘 NotReady Logical Disk NotReady CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘 SMARTFail Hard Disk SMARTFail CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
BIOS不可纠正的CPU复杂错误 BIOS uncorrectable CPU complex error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘寿命耗尽 Hard drive life exhausted CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
系统固件错误 System firmware error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
检测到主板故障 Motherboard failure detected CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
检测到主板故障 Motherboard failure detected CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
不可纠正内存 Uncorrectable memory CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
不可纠正的硬检错误 Uncorrectable hard check error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
不可纠正内存ECC错误 Uncorrectable memory ECC error CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
不确定的硬件故障 Uncertain hardware failure CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
不可恢复的IDE设备故障 Unrecoverable IDE device failure CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
不可恢复的主板故障 Unrecoverable motherboard failure CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
不可恢复的视频控制器故障 Unrecoverable video controller failure CRITICAL 您的BBC实例${InstanceName}出现严重故障,在您确认实例业务可下线或完成迁移,并尽快进行维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘SMARTFail Hard Disk SMARTFail CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘寿命耗尽 Hard drive life exhausted CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
硬盘出现大量报错 A large number of errors are reported on the hard disk WARNING 您的BBC实例${InstanceName}出现故障,建议您进行重启并保持对实例的关注,如果问题无法解决,请通过工单联系百度智能云后台进行设备检修。
硬盘读写出现大量故障扇区 A large number of faulty sectors in hard disk read and write CRITICAL 您的BBC实例${InstanceName}出现严重故障,实例数据可能受到影响。您需要进行实例业务和数据转移,并尽快发起维修任务授权。授权后,后台将自动执行处理动作,您可在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。
智能卡异常 RepairSNICError CRITICAL 您的BBC实例出现智能卡异常情况,在您确认业务情况并授权维修后,后台将会自动进行相应处理动作,尽快完成相关维护动作。您可以在维修平台查看维修任务进度,或通过工单与百度智能云后台联系。

云服务器 BCC

事件中文别名 事件英文别名 事件级别 处理方法与建议
GPU出现总线故障带宽下降 GPU bus failure and bandwidth drop CRITICAL
GPU自身内存出现故障 GPU memory failure CRITICAL
GPU温度过高 GPU temperature is too high CRITICAL
GPU掉卡 GPU dropped CRITICAL
BCC实例宕机 BCC Instance Down CRITICAL
BCC实例热迁移 BCC instance thermal migration NOTICE
BCC实例宕机恢复 BCC Instance Up NOTICE
恢复健康 Regain health NOTICE
BCC硬件故障 RepairBccHardwareError CRITICAL 您的BCC实例${InstanceName}所在宿主机硬件出现故障,当前宿主机正在维修中,BCC实例即将重启,若您的业务具备灾备能力请及时切换并在维修平台发起维修任务的授权。
BCC系统升级 RepairBccSystemUpgrade CRITICAL 您的BCC实例${InstanceName}即将升级,升级过程中会进行实例重启,若您的业务具备灾备能力请及时切换并在维修平台发起维修任务的授权。
BCC状态变化通知 InstanceStateChange NOTICE 您的BCC实例${InstanceName}状态已变更为${当前状态}

专线网关

事件中文别名 事件英文别名 事件级别 处理方法与建议
专线网关不可用 LinkProbeInavailable 故障 此专线网关的链路探测故障是否符合预期,若是在预期外的专线故障,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
专线网关可用 LinkProbeAvailable 通知 专线网关已正常。

专线通道

事件中文别名 事件英文别名 事件级别 处理方法与建议
专线通道bgp peer状态down dedicatedconn_channel bgp status down 故障 专线通道BGP PEER断开
专线通道bgp peer状态up dedicatedconn_channel bgp status up 通知 专线通道BGP PEER 邻居可用
专线通道BFD状态DOWN BFDStatusDown 故障 此专线通道的 BFD 状态为 DOWN,希望您尽快评估业务情况,排查原因。
专线通道BFD状态UP BFDStatusUp 通知 此专线通道的 BFD 状态为 UP,请知晓。

物理专线

事件中文别名 事件英文别名 事件级别 处理方法与建议
物理专线流量水位告警 TrafficCongestionFault 通知 此物理专线的流量水位状态是否符合预期,若是在预期外的专线流量水位告警,希望您尽快评估业务情况,排查原因。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
物理专线流量水位恢复 TrafficCongestionRecover 通知 物理专线的流量水位状态已恢复。
EVR整机故障 EVR_FAULT 故障 此物理专线所在的百度侧接入设备出现整机故障。百度工程师正在努力排查,请您时刻关注。

DDoS高防IP

事件中文别名 事件英文别名 事件级别 处理方法与建议
EIP攻击事件 EIP attack events WARNING

MapReduce BMR

事件中文别名 事件英文别名 事件级别 处理方法与建议
主机宕 BMR_INSTANCE_EVENT_DOWN CRITICAL 请联系服务人员处理
主机宕恢复 BMR_INSTANCE_EVENT_UP NOTICE 请知晓
组件宕 BMR_COMPONENT_EVENT_DOWN CRITICAL 请联系服务人员处理
组件宕恢复 BMR_COMPONENT_EVENT_UP NOTICE 请知晓
BMR-Agent断联 BMR_AGENT_EVENT_UNCONNECT CRITICAL 请联系服务人员处理
BMR-Agent连接恢复 BMR_AGENT_EVENT_CONNECT NOTICE 请知晓
Active Master发生切换 BMR_CLUSTER_ACTIVE_MASTER_CHANGE WARNING 请联系服务人员处理

产品变更

事件中文别名 事件英文别名 事件级别 处理方法与建议
产品上线 product deploy events 通知 【操作通告】百度云将苏州C4集群基础服务POD默认路由策略调整
【操作时间】2021.03.11 01:00-02:00
【操作影响】本次操作理论无感

云数据库专属集群 DDC

事件中文别名 事件英文别名 事件级别 处理方法与建议
用户发起实例变配失败 resizeFail WARNING 此次实例变配失败后数据库业务是否符合预期,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
用户发起实例变配开始 resizeStart NOTICE 此次实例变配操作是否符合预期,若是在预期外的操作,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
用户发起实例变配成功 resizeSuccess NOTICE 此次实例变配成功后数据库业务是否符合预期,希望您尽快评估业务情况。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
用户发起实例重启失败 restartFail WARNING 此次实例重启失败后数据库业务是否符合预期,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
用户发起实例重启开始 restartStart NOTICE 此次实例重启操作是否符合预期,若是在预期外的操作,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
用户发起实例重启成功 restartSuccess NOTICE 此次实例重启成功后数据库业务是否符合预期,希望您尽快评估业务情况。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
用户发起主备切换失败 switchOverFail WARNING 此次主备切换失败后数据库业务是否符合预期,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
用户发起主备切换开始 switchOverStart NOTICE 此次主备切换操作是否符合预期,若是在预期外的操作,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
用户发起主备切换成功 switchOverSuccess NOTICE 此次实例重启成功后数据库业务是否符合预期,希望您尽快评估业务情况。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。

容器引擎 CCE

事件中文别名 事件英文别名 事件级别 处理方法与建议
CCE 集群异常事件 Abnormal event of CCE cluster WARNING 请登录 CCE 集群 cce-1jgp2w0x 排查问题
CCE 集群节点 NotReady Node not ready in CCE cluster CRITICAL 请登录 CCE 集群 cce-1jgp2w0x 排查问题
CCE Pod 异常事件 Abnormal event of CCE pod WARNING 请登录 CCE 集群 cce-1jgp2w0x 排查问题

云数据库 SCS for Redis

事件中文别名 事件英文别名 事件级别 处理方法与建议
故障切换开始 failOverStart 通知 此次主备切换后数据库业务是否符合预期,若是在预期外的切换故障,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
故障切换成功 failOverSuccess 通知 此次主备切换后数据库业务是否符合预期,若是在预期外的切换故障,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
规格变更开始 SpecificationChangesStart 通知 此次节点规格变更是否符合预期,若是在预期外的规格变更,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
规格变更成功 SpecificationChangesSuccess 通知 此次节点规格变更已成功,数据库业务是否符合预期,若在预期之外,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。
规格变更失败 SpecificationChangesFailed 通知 此次节点规格变更失败,希望您尽快评估业务情况,排查故障点。百度工程师会同步进行百度侧相关功能的排查,为您的业务保驾护航。

对象存储 BOS

事件中文别名 事件英文别名 事件级别 处理方法与建议
Bucket上传超时 BucketUploadTimeout 警告 您在华北-北京地域创建的Bucket(名称:BucketName)出现上传超时情况,请尽快处理,谢谢
Bucket下载超时 BucketDownloadTimeout 警告 您在华北-北京地域创建的Bucket(名称:BucketName)出现下载超时情况,请尽快处理,谢谢
Bucket总带宽即将超过流控 BucketBandwidthThresholdExceededSoon 通知 您在华北-北京地域创建的Bucket(名称:BucketName)即将超出带宽阈值,请及时通过工单与我们联系并调整,谢谢
Bucket总带宽超过流控 BucketBandwidthThresholdExceeded 警告 您在华北-北京地域创建的Bucket(名称:BucketName)已超出带宽阈值,请及时通过工单与我们联系并调整,谢谢
相似文档
  • 如果您的账号下存在大量云资源,可通过实例组来批量管理这些云资源。当您需要通过同一套报警规则对多个实例组或者全部实例、标签等维度设置报警时,可以通过创建报警模板,快速完成批量报警设置。
  • 如果您在实际使用云监控过程中,对于消息通知渠道有不同的场景和需求,可以通过云监控BCM提供的多种方式满足需求。 需求背景: 某用户需要通过多渠道来及时接收到报警消息,以满足不同场景下需求。
  • 云顾问ACA基于百度智能云多年运维实践沉淀出的最佳实践,对用户使用百度智能云时可能遇到的问题与风险进行系统性检查与报告,并对于有风险的检查项给出解决建议和技术支持。
  • 2021-12 新增7个检查项:专线ET-使用率过高、专线ET-丢包率检查、EIP-绑定安全风险、SCS-高危命令检查、配额检查等。 2021-9 新增11个检查项: RDS-空间使用率过高、BLB-后端实例停用、BOS错误率异常巡检、BCC-磁盘使用率过高、BBC-CPU使用率过高。
  • 科学的检查结果分级: 科学的检查结果分级有助于理解风险。百度智能云顾问的检查项,最多有3种可能的检查结果,分别是高危、警告和正常。每个检查项的高危和警告判断标准基于百度智能云多年的运维管理最佳实践,并完全对用户公开,便于用户深入理解和分析账户和资源情况。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部