资讯首页 新闻资讯 云计算测评 云服务商动态 技术频道
上云无忧 > 云计算资讯  > 新闻资讯 > 阿里云与清华大学联合发布业界最大中文多模态预训练 AI 模型:M6

阿里云与清华大学联合发布业界最大中文多模态预训练 AI 模型:M6

发布时间: 2021-03-02 19:25:59|浏览量:293| 评论: 0

一分钟完成服饰、家具的作品设计,成为设计师的有力助手——


这是阿里巴巴与清华大学联合发布的业界最大中文多模态预训练AI模型:M6。


M6模型参数规模高达1000亿,是多模态预训练领域史上最大的模型。以图像生成上的应用为例,M6可以设计包括服饰、鞋类、家具、首饰、书籍等在内的30多个物品类别的图像,最短一分钟即可完成作品的创作。
图片

M6是如何做到快速、精细设计的?

因为M6是一种“多模态预训练模型”,作为一种新型AI的训练方法,它突破了传统深度学习方法的瓶颈,能让AI具备认知能力。

M6的训练路径是:首先,自动学习大量语言文字和图像数据,记忆和理解人类丰富的先验知识,再进一步学习专业领域信息,从而让AI同时掌握常识和专业知识。

M6的突破,源自多项底层技术创新。阿里巴巴研究团队基于自研Whale分布式框架,将参数规模扩展到千亿的同时,利用大规模数据并行和模型并行,训练速度提升10倍以上,仅需1-2天即可完成上亿数据的预训练。

阿里M6模型根据文本内容自动设计图片

此外,M6模型首次将多模态预训练模型应用到基于文本的图像生成任务,结合向量量化生成对抗网络学习文本与图像编码共同建模的任务,能够生成清晰度高且细节丰富的图像。


多模态预训练是下一代人工智能的基础,M6模型实现了训练效率和生成精度等多项突破,是当前众多中文多模态下游任务最优模型。

——阿里巴巴达摩院智能计算实验室资深算法专家杨红霞


作为国内最早投入认知智能研究的科技公司之一,阿里巴巴已有30多项认知智能领域研究成果被国际顶级会议收录。


下一步,研究团队还将研发更高规模的万亿参数多模态预训练模型,持续突破算力及预训练模型的极限,最终实现通用领域的高质量泛内容生成。

更多【新闻资讯】相关文章

有话要说

全部评论

暂无评论
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部