金山云:揭秘央视春晚直播背后的技术硬实力
| 2020年1月24日晚间8点,一首开年贺岁歌舞《春潮颂》拉开了鼠年春晚的序幕。《这就是街舞》、2019第一神曲《野狼Disco》的改编版本《过年迪斯科》、《风雪饺子情》、《走过场》等众多的节目更是将春晚推向了一波又一波的高潮。 
	 
	 
	 
	 
	 不仅如此,今年春晚北京主会场与粤港澳大湾区、郑州分会场全面通过5G网络进行互动,央视首次制作8K超高清电视版2020春晚,为观众带来史无前例的视觉震撼。今年春晚还与快手合作,推出10亿春晚红包,通过创新大小屏联动方式,使得今年的春晚流量峰值再创历年新高。 
	 
	 
	 
	 为保障海量用户同步、高清收看央视网的春晚直播节目,金山云团队伙伴们事先对直播所需带宽进行了详细地评估。同时,利用金山云自身充足的节点资源和带宽资源,确保对直播形成的峰值带宽压力形成稳定支撑。如果流量峰值超出预测,金山云将在1分钟内在客户的流量调度组中增加节点,扩充总容量,满足带宽需求。 
	 金山云技术团队预测,在20点联欢晚会开始的每个整点时刻,会进入流量的高峰时段;同时结合主要客户的业务推广内容,会出现由抢红包活动导致的用户访问高潮。为确保高并发、高QPS的数据流量访问,金山云采用了金山云自主研发的智能调度系统,更好地保证了直播过程中智能调度的实现。 
	 此系统包括“负载均衡器”、“金山云鹰眼”、“智能阀”三大功能模块。金山云团队先是用“金山云鹰眼”监测数据,看数据有没有达到“水位”,如果“水位”将近,“智能阀”将开启,提前预警和分配资源,再由智能调度系统调整流量的走向,从而实现流量的智能调度。 
	 其中金山云KVS,全称 KSyun Virtual Server,是一套基于 LVS 研发改造优化的自动负载均衡系统,具有可用性高,稳定性好,扩展性强等特点。金山云KVS可以对每台 real server 设置不同的权重值,让性能好的资源承担更多的用户请求,合理的利用现有的资源。同时,金山云KVS 还可以自动查询 real server 的负载情况,动态调整权重来进行合理的资源分配。 
	 值得一提的是,金山云在业内率先支持直播推拉流over QUIC,金山视频云直播QUIC+解决方案(在丢包率达到30%时流畅度仍达96.51%)在此次直播重保中发挥了重要的作用。 
	 金山云CDN边缘节点可实现对直播内容的预拉取 
	 
	 除此之外,金山云团队在此次保障过程中,采用了业界首创的多流择优技术。即允许同一个直播信号频道多点同时注入CDN,通过对多个原始信号源的对齐编排,确保信号共存,并通过自研的高敏感度抖动算法,及时感知不同信号源的抖动情况,在毫秒尺度上筛选出最优的信号源作为向下分发的主信号,且支持最优信号源在毫秒级别上平滑切换而不引起跳帧或者重复播放。同时,在金山云历经考验的内部链路动态优选的强力加持下,确保直播信号在CDN内部稳定传输。 
	 “智能调度系统+源站分流+边缘直播内容预拉取+多流优技术”四招共同构造了金山云视频直播的技术实力,也成为金山云在直播架构上的优势所在。 
	 高码率、高并发QPS请求 提供全套能力服务体系 
	 
	 为更有效保障业务高峰时超清视频及VR视频传输稳定性,金山云技术团队与央视网一起重新优化系统架构,通过资源打通,实现了在技术、管理、运营等维度的全方位联动,最大程度保证了活动的顺利进行。 
	 目前,金山云在国内有1000+CDN节点,全网带宽储备达100Tbps,能够在最大程度上保证此次央视春晚的内容快速、稳定分发。此外,金山云的CDN产品基于超大规模的分布式集群,拥有海量并发能力,能够提供稳定、流畅、丰富的网络加速服务,同时,金山云全息透明化数据支撑体系,能够实现全方位高可用服务保障,为客户提供低延时、弹性透明化的CDN服务。 
	 针对高清视频、VR等视频应用,金山云视频云分发节点进行专门的大容量设计,在系统架构层面采用新一代Cache架构Dorado,多级缓存技术、多线程等技术的应用,提高并发能力性能,稳定性提升50%以上;在硬件设备层面,采用了第三代DMA技术(SSD+MemCache+AIO),同时针对编译器、存储和网络进行专门优化,I/O性能提高400%;在传输协议层面,金山云TCP网络经过内核优化,传输效率提升30%。 
	 为进一步减少带宽的占用,在此次重保过程中,金山云提供了包括直播、点播、下载、小文件等完整的CDN产品矩阵以及包括边缘计算、集智高清、P2P、QUIC双边加速等一系列技术体系在内的全方位技术服务。 
	 其中,集智高清融合多种技术使编码后的视频体积缩小,节省20%-40%视频传输带宽,配合KSC265转码技术可二次降低视频传输带宽。金山云提供AI+ AV1 智能云转码服务,压缩率高达80.57%,业界领先。 
	 在边缘计算层面,目前金山云边缘计算在大数据上传与API加速场景中,文件上传速度加快40%,上传成功率提高到99.5%,API服务查询请求成功率提高到99.9%;在同城直播的场景中,允许同城亲友就近拉流观看,大幅节省骨干网带宽并提升观看质量。 
	 除了集智高清、多流择优、协议优化等基础手段外,针对5G背景下的超高清、VR直播,金山云也做了相应的技术储备。CMAF低时延分发方案,不仅解决了HLS、DASH等协议的延时“硬伤”,其所具有的多码率自适应功能,结合对齐转码技术,能够同时提供8K、4K、1080P甚至更低的多档码率自适应输出,以匹配不同网络情况下的终端用户能够同时享受或高清或流畅的极致体验。 
	 正因如此,凭借金山云所提供的包括视频云和CDN整套的技术服务体系和资源储备能力,金山云经受了高清视频的大流量和一波又一波的抢红包流量高峰冲击。 
	 客户成功保障平台 提供全方位的保障能力 
	 
	 业内对于“客户成功保障平台”并不陌生。在2019年12月26日举办的“2019金牌运维大会”上,金山云“客户成功保障平台”被评为《2019运维行业年度优秀案例》。 
	 众所周知,公有云为客户资源弹性提供了便利,但同时对于公有云运维人员带来了,缺乏从客户视角看问题的技术手段、缺乏有效的主动性保障手段以及缺乏客户产品体验全局实时认知等困难。为助力公有云客户业务成功,实现商业结果的双赢,金山云推出“客户成功保障平台”提供全方位的保障能力。 
	 其中,金山云开发的“重保机器人’,可根据重保需求自动创建专门的保障沟通群,针对客户重保期间的问题集中群内沟通,避免信息碎片化;“重保机器人”根据需求监控客户的资源稳定性,添加“全方位的监控”,创建相应的“客户资源监控大屏”,设置“灵敏的告警阈值”,确保可先客户一步获悉问题所在;此外,“重保机器人”将告警、工单派发到处理人,并监督处理人在一定时间内处理完成,极大地提高了人工的工作效率。 
	 
	 在全民防范病毒传播的特殊时期里,当我们在家中看着春晚捧腹大笑时,金山云每个重保程序员都积极做好卫生防范,进门测体温,大家都戴着口罩在2020金山云春节保障指挥中心里,为央视春晚直播顺利进行贡献自己的力量。 
	 不可否认,金山云为央视春晚直播成功重保,再一次证明了金山云强大的技术实力。未来,随着5G超高清以及VR时代的到来,金山云将提供更加全面的技术和服务能力,为更多的重大事件和赛事活动直播而保驾护航。 | 


 
 

有话要说