腾讯云混元:开源模型生图时间缩短75%!
先和大家汇报: 开源不到一个月,腾讯混元文生图大模型(混元DiT模型)的Github Star数已达到2.1k,位于开源社区热门DiT模型前列! 这是业内首个中文原生的DiT架构文生图开源模型,可供企业与个人开发者免费商用。 开源后,我们也听到了不少开发者的呼声: 需求收到,马上安排! 刚刚,腾讯混元针对文生图开源模型,发布一组「加速库」: 实测显示,加速后的生图时间缩短75%、生图速度提升4倍,大幅提升模型运行效率。 这也是业内首个由官方推出的加速库。 //生图速度,更快了 具体来说,这款加速器叠了两套buff: 一是,知识蒸馏 通过降低扩散模型迭代的步数实现加速(就像看学霸的笔记,跳过部分训练步骤,直接借鉴复杂模型的经验,掌握重点)。 使用蒸馏权重后,生成同等质量的图像,迭代步数减半。 二是,TensorRT推理加速 通过工程优化,减少冗余计算、合并层次、精简精度,让模型更快处理数据。 而且,它还支持与模型权重解耦(开发者可以在不影响模型权重的情况下,对模型进行优化和调整,满足不同的应用需求)。 为了提升开源模型易用性,我们还做了一些努力: //使用方式,更简单了 现在,用户可以基于ComfyUI的图形化界面,使用腾讯混元文生图模型。 (ComfyUI是一款文生图领域的WebUI界面设计,用户可以通过图像化的工作流的方式使用模型,大幅降低开发者的使用门槛) (混元DiT文生图模型的ComfyUI使用界面) //生态组件,更丰富了 仅用三行代码,用户就能在Hugging Face的官方模型库Diffusers中调用混元DiT模型,无需下载原始代码库。 (Hugging Face的Diffusers是知名的AI开源社区,也是调用各种主流文生图大模型的通用库,已成为当今文生图大模型使用的社区标准) (混元DiT文生图模型的Diffusers界面) 腾讯正在持续投入开源大模型生态建设。 我们希望,用更快的推理体验、更简单的使用方式、更丰富的生态组件,进一步降低大模型技术的使用门槛,惠及更多开发者和用户。 附腾讯混元文生图开源大模型(混元DiT模型)项目链接 官网:https://dit.hunyuan.tencent.com/ 代码:https://github.com/Tencent/HunyuanDiT 模型:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT 论文:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf |
全部评论
暂无评论
有话要说