上云无忧 > 文档中心 > 百度智能云音视频处理的功能
音视频处理
百度智能云音视频处理的功能

文档简介:
视频处理将音视频文件转码为不同分辨率、不同格式的文件,以满足不同网络带宽、不同终端设备的用户需求。核心能力特性如下所示: 转码格式:覆盖主流的视频转码格式。 视频编码:丰富的视频编码参数支持,支持多种视频格式、视频分辨率、不同码率等。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

视频处理将音视频文件转码为不同分辨率、不同格式的文件,以满足不同网络带宽、不同终端设备的用户需求。核心能力特性如下所示:

  • 转码格式:覆盖主流的视频转码格式。
  • 视频编码:丰富的视频编码参数支持,支持多种视频格式、视频分辨率、不同码率等。
  • 音频编码:支持多种音频编码格式支持等。
  • 视频编辑:支持对视频进行剪辑拼接等二次操作。
  • 视频截图:多种视频截图能力,满足不同场景的需求,截取精美封面,提高视频点击率。
  • 视频加密:版权保护,防盗播。
  • 智感超清:通过视频AI的能力,提高视频的清晰度,降低视频的码率。
  • 极速转码:音视频分离,动态分片技术提高转码速度,最高可达50倍速。
  • BD265:采用了50多个编码优化算法和AI编码技术,以更低的码率更快的速度提供更高的画质。

转码格式

类别 说明
输入格式 · 封装格式:MP4、FLV、MOV、M3U8、3GP、AVI、MPG、ASF、WMV、MKV、TS、WebM、MXF;
· 视频编码格式:H.264/AVC、H.265/HEVC、MPEG-1、MPEG-2、MPEG-4、MJPEG、VP8、VP9、Quicktime、RealVideo、Windows Media Video ;
· 音频编码格式:AAC、AC-3、ADPCM、AMR、DSD、MP1、MP2、MP3、PCM、RealAudio、Windows Media Audio
输出格式 · 视频封装格式:FLV、MP4、HLS(m3u8+ts)、MPEG-DASH(MPD+fMP4);
· 音频封装格式:MP3、MP4、OGG、FLAC、m4a;
· 图片封装格式:JPG、PNG、GIF、WEBP;
· 视频编码格式:H.264/AVC、 H.265/HEVC;
· 音频编码格式:MP3、AAC、VORBIS、FLAC

视频编码

参数 说明
codec 编码标准:h264、h265,默认为h264
profile 编码级别:baseline, main, high,默认为baseline,h265只支持main
bitRateInbps 目标码率,范围[100, 50000],单位kbps
maxFrameRate 最大帧率,选项为:10,15, 23.97, 24, 25, 29.97, 30, 50, 60
maxWidthInPixel 分辨率的宽,范围[128,4096]
maxHeightInPixel 分辨率的高,范围[96,3072]
sizingPolicy 伸缩策略,包括:
· Keep:当源视频宽高均小于模板宽高时,保持源视频分辨率不变;当源视频的宽或高大与模板时,长边缩小至与模板一致,另一边等比例缩放。
· shrinkToFit:保持原始视频宽高比并加黑边以达到模板的分辨率;
· shrinkToFitBlur:保持原始视频宽高比并加高斯模糊效果以达到模板的分辨率;
· stretch:表示拉伸原始视频,以达到模板分辨率。
crf 码率控制策略:
· 默认为VBR;
· 可设定恒定质量crf,范围 [1, 51]
playbackSpeed 倍速播放:范围 [0.05,20.0]
· 低于1.0时为减速播放;
· 高于1.0时为加速播放。
transMode 转码模式,支持:normal、twopass、cae(智感超清)

音频编码

参数 说明
codec 默认为AAC
bitRateInBps 目标码率,范围 [0,1000]
ampleRateInHz 音频采样率,选项:22050, 32000, 44100, 48000, 96000
channels 音频声道数,选项:1, 2
gain 音量大小,范围[-60,60],单位db,值为负调小音量,值为正调大音量。
mute 是否静音
norm 是否进行音量归一化,避免音量忽高忽低

视频编辑

功能 说明
视频拼接 最多支持200个视频拼接成1个
视频剪辑 支持设置起始时间、持续时长,单位为秒或毫秒
去水印 支持设置去水印的区域(x、y、width、height),支持自动识别水印并去除
去黑边 支持设置裁剪黑边后的有效画面区域(x、y、width、height),支持自动检测黑边区域
高斯模糊 支持动态高斯模糊效果填充
叠加静态/动态水印 格式包括:jpg、png、apng、gif、webp、mov、mp4等,支持设置显示位置和起始时间
叠加字幕 支持srt字幕文件;支持设置字体、字号、显示位置和起始时间
叠加音频 支持音频格式包括mp3、aac等

视频截图

功能 说明
指定
截图
· manual:按指定的起止时间和间隔时间截取缩略图;
· split:按指定的起止时间和张数截取缩略图;
· splitss0:在split模式的基础上保证截取首帧
智能
截图
· auto:自动截取熵值较高的一帧;
· shot:根据场景切换自动截取转场画面帧;
· idl:使用百度IDL(Institute of Deep Learning)智能缩略图算法截取一帧缩略图;
· highlight:根据AI模型,自动生成一个0.5s精彩片段,可设置截取时长
雪碧图 可指定雪碧图的行、列、外框宽度、子图间隔
图片
格式
· 静态图片格式:jpg、png
· 动态图片:gif、webp、mp4
· 动态图片支持设置帧率和播放倍速
图片
宽高
宽/高范围 [10,2000],宽默认600,高默认450,若视频实际分辨率低于目标分辨率则按照实际分辨率输出
伸缩
策略
· keep表示保持原始视频宽高比;
· shrinkToFit表示保持原始视频宽高比并加黑边;
· stretch表示拉伸原始视频
去水印 可指定去水印的模糊区域(x、y、width、height)
黑边
剪裁
可指定去黑边后的有效画面区域(x、y、width、height),支持自动黑边区域检测

媒体信息

类别 说明
文件信息 包括:文件大小、文件时长、容器格式、文件类型、MD5值
视频信息 包括:编码标准、分辨率(宽/高)、码率、帧率
音频信息 包括:编码标准、声道、采样率、码率

视频加密

加密模式 说明
fixed 固定密钥加密,使用用户指定的密钥对视频进行加密,此时需要aesKey;
open 开放密钥,系统自动生成加密密钥,密钥公开,不设访问控制;
playerBinding 系统自动生成加密密钥,密钥设有访问控制,绑定播放器,安全性比较高,推荐。

智感超清

类别 说明
智感超清1.0 对视频场景级别的画面复杂度进行智能分析,动态分配最优编码参数,同等画质下,码率更低,从而节省带宽成本和存储成本。
智感超清2.0 以人眼主观体验最好为目标,对画面的颜色、亮度、对比度、饱和度等调优,强化人眼关注区画面质量,节省码率的同时,提高画面质量。
老片修复 针对老片或过度压缩的视频,去除抖动、划痕、噪点、马赛克等,提高画面清晰度。智感超清2.0的垂直应用场景。
智能插帧 对于30帧/秒及以内的普通帧率视频,生成60帧/秒甚至120帧/秒的高帧率版本,提高画面流畅度,一般配合超分使用。
超分辨率 利用深度学习模型,提升视频画面的细节,将低分辨率重建至高分辨率,例如:SD转HD 、2K转4K等。

极速转码

极速转码包含普通极速转码和智能极速转码。

普通极速转码通过音视频分离的技术,对音频、视频分开转码,减少视频merge时间,对于长视频转码倍速可达10倍速。

智能极速转码在普通极速转码的基础上,根据输入视频/输出模板的属性(Codec、B帧、帧率、码率、分辨率等),通过AI模型预测分片策略,转码速度最高可达50倍速。

BD265

BD265编码器,采用了50多个编码优化算法和AI编码技术,以更低的码率更快的速度提供更高的画质。

BD265在编码过程中利用多种细化的预测模型显著减少了运动估计、模式选择和率失真优化的计算开销,大大提升了编码速度。对比开源的HEVC编码器(x265), BD265在同等主观质量下能节省30%-40%码率,同时编码速度提升2倍以上。BD265结合最新的视觉编码技术和动态码率分配算法,将每一个比特花在人眼敏感的地方,提供了更好的主观质量。BD265编码器支持丰富的编码档位,如快速档、普通档、慢速档以及多种编码配置如crf、abr、two pass,可以快速部署到直播、点播、短视频等多种应用场景。

相似文档
  • 高质量: 通过AI模型深度学习,根据视频复杂度动态分配最优编码参数,基于人眼主观的画面增强,支持画质修复、超分辨率,并结合codec本身的深度调优,大幅提升画面质量。
  • 服务区域:目前支持华北-北京、华南-广州、华东-苏州三个地域。 如果没有特定需求,请优先选择华北-北京。 任务队列:每个账号队列总量量为100。即每个账号最多可同时处理100个转码/截图任务。若想扩容可提交工单申请。
  • 计费项: 音视频处理服务是将存储在BOS上的音视频文件进行转码处理,转成适合终端播放的不同清晰度不同格式,并可通过CDN加速将目标音视频文件分发到各种终端,因此费用涉及三部分:对象存储 BOS、(可选)内容分发网络 CDN、音视频处理 MCP。
  • 您可直接在MCP管理控制台的“转码包”菜单页面,点击【购买转码包】直接购买。 计费价格: 混合时长转码包价格的详细信息,请点击音视频处理MCP价格说明中的“预付费”查看。 抵扣比例: 混合时长转码包计费方式(抵扣时长比例:与标准使用时长的比例):
  • 音视频处理服务的计费项包括:转码时长和接口请求次数。根据您的使用情况,各计费项单独计量计费,不使用不计费。 转码输出文件时长: 计费价格: 普通转码、智感超清1.0、智感超清2.0、超分辨率、极速转码的转码价格,请点击音视频处理MCP价格说明中的“后付费”查看。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部