智谱联合华为开源 GLM-Image 国产算力训出 SOTA 级文生图模型

匿名作者
2026-01-14 11:4683

智谱 AI 正式开源基于华为昇腾底座训练的新一代图像生成模型 GLM-Image。作为首个在国产芯片上完成全流程训练的 SOTA 多模态模型,它凭借创新的混合架构在汉字生成与复杂指令理解上取得了突破性进展。

国产全栈算力的里程碑验证

GLM-Image 的发布不仅仅是一个新模型的诞生,更是国产算力生态的一次重要“阅兵”。该模型完全基于华为昇腾 Atlas 800T A2 设备与昇思 MindSpore 框架完成,涵盖了从数据预处理到大规模训练的每一个环节。

这一成果有力地打破了业界对国产芯片无法训练顶尖(SOTA)模型的质疑,验证了国产软硬件全栈技术在处理大规模、高复杂度 AI 任务时的成熟度与可靠性。对于依赖外部算力的中国 AI 产业而言,这是一剂强有力的强心针。

混合架构解决绘画痛点

在技术架构上,GLM-Image 采用了“自回归 + 扩散解码器”的创新混合设计。这种架构巧妙地结合了语言模型对语义的深刻理解与扩散模型的高质量生成能力。

这一融合使得模型在处理“知识密集型”任务时表现尤为出色。它能够精准理解全局指令并刻画局部细节,有效解决了长期困扰 AI 绘画领域的难题,如海报排版中的文字一致性、PPT 制作的结构逻辑以及复杂科普图的精准生成。在多项权威评测榜单中,GLM-Image 均位列开源模型首位,尤其在极具挑战性的汉字生成任务上,展现了断层式的领先优势。

Google_AI_Studio_2026-01-14T03_34_56.521Z.png

图源备注:图片由AI生成

高性价比普惠创作者

为了推动技术的规模化应用,GLM-Image 已在 GitHub 和 Hugging Face 全面开源。除了技术上的开放,智谱在商业化路径上也极具诚意。其 API 调用价格低至每张图 0.1 元,且模型原生支持 1024 到 2048 尺寸的任意比例自适应生成。

这种低门槛、高灵活性的策略,旨在让更多的开发者与创作者能够利用高端生成式 AI 技术。智谱方面还透露,未来将推出经过速度优化的新版本,进一步提升商用性价比,加速国产认知型生成技术在各行各业的普及。

Google_AI_Studio_2026-01-14T03_34_58.861Z.png

图源备注:图片由AI生成

评论 (0)

暂无评论,快来发表第一条评论吧!

AI 技术峰会

2025 AI 技术峰会

AI 实战课程

AI 实战课程

热门工具

AI 助手

智能对话,提升效率

智能图像处理

一键美化,智能修图

AI 翻译

多语言实时翻译