新闻动态 > /    产品发布 >

AMD推出Nitro-T:高效训练的文字转图像扩散模型

2025-07-16 11:01:18 更新
1

AMD去年尾发表过Nitro-T , 而日前正式发布Nitro-T系列及公开下戴, 这是专注于高效训练的文字转图像扩散模型, Nitro-T 仅使用32 颗AMD Instinct MI300X GPU从零开始训练不到一天, 即可达到竞争性的效果

Nitro-T 提供两种variants , 已可在huggingface9免费下载:

– 0.6B 参数的Diffusion Transformer (DiT):最佳化于512px 图像生成

– 1.2B 参数的Multimodal Diffusion Transformer (MMDiT):最佳化于高解析度1024px 图像生成

这些模型使用Llama 3.2 1B 模型作为文字条件输入并采用可缩短patch 序列长度、加速收敛与提升训练吞吐量的策略与设计选择


image.png

Nitro-T-0.6B (huggingface.co)

Nitro-T-1.2B (huggingface.co)

Nitro-T- code (github.com/A)

收藏 1 点赞

加入组织

本站声明

本站所有资源仅供学习参考练习使用!!!没特别声明能商用的,禁止商用,出现法律问题自行承担!如若本站内容侵犯了原著者的合法权益,可联系我们删除链接处理。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。For users from other countries to register, please contact me. Email:cgshop@qq.com