基于领先的视觉技术,利用海量的图像、视频等数据,为企业和开发者提供强大的视觉基础模型,以及一整套视觉任务定制与应用能力。
VIMER-CAE
视觉自监督预训练模型,创新性地提出“在隐含的编码表征空间完成掩码预测任务”的预训练框架,在图像分类、目标检测、语义分割等经典下游任务上达到SOTA结果
VIMER-UFO
视觉多任务统一大模型,可抽取轻量级小模型,兼顾大模型效果和小模型推理性能,单模型覆盖20+CV基础任务,在28个公开测试集上效果SOTA
VIMER-StrucTexT
端到端文档OCR表征学习预训练模型,创新性地提出“单模态图像输入、多模态表征学习”预训练框架,在5项文档图像理解任务上刷新SOTA结果
VIMER-UMS
行业首个统一视觉单模态与多源图文模态表征的商品多模态预训练模型,在多个商品下游视觉检索、跨模态检索任务上达到SOTA
文心·CV大模型
视觉自监督预训练模型,创新性地提出“在隐含的编码表征空间完成掩码预测任务”的预训练框架,在图像分类、目标检测、语义分割等经典下游任务上达到SOTA结果
VIMER-UFO
视觉多任务统一大模型,可抽取轻量级小模型,兼顾大模型效果和小模型推理性能,单模型覆盖20+CV基础任务,在28个公开测试集上效果SOTA
VIMER-StrucTexT
端到端文档OCR表征学习预训练模型,创新性地提出“单模态图像输入、多模态表征学习”预训练框架,在5项文档图像理解任务上刷新SOTA结果
VIMER-UMS
行业首个统一视觉单模态与多源图文模态表征的商品多模态预训练模型,在多个商品下游视觉检索、跨模态检索任务上达到SOTA
工具与平台
零门槛AI开发平台EasyDL
面向AI应用开发者,零代码实现基于文心大模型定制您专属的AI模型,可一键发起模型训练、模型效果校验,支持多端部署。
全功能AI开发平台BML
面向AI算法开发者,提供集成化的开发环境,支持基于文心大模型进行高效定制开发,一站式完成AI模型全生命周期管理。