智谱 GLM-5 借力稀疏架构突围 资本热捧助推市值千亿新高

匿名作者
2026-02-11 10:3414

国产大模型赛道在 2026 年春节期间迎来高光时刻。GLM-5 的发布不仅在技术路线上验证了稀疏注意力架构的可行性,更在资本市场上演了一场造富神话。

马甲曝光后的资本狂欢

继 DeepSeek 之后,智谱 AI 的新一代大模型 GLM-5 成为了市场的绝对焦点。这一动作直接引爆了资本市场,导致智谱股价近期大涨 200%,总市值冲破 1500 亿港币大关,达到其 IPO 时的 3 倍。

此前,全球模型服务平台 OpenRouter 上出现了一款代号为“Pony Alpha”的神秘模型,其代码编写能力直逼行业顶尖的 Claude Opus。经过网友对其特有逻辑 Bug(如特定且异常的烹饪问答)的“指纹识别”,以及系统提示词的自曝,该模型的真实身份最终被确认为 GLM-5。

Generated Image February 11, 2026 - 10_28AM.png

图源备注:图片由AI生成

复用 DSA 架构的参数跃升

在技术路线上,GLM-5 选择了与 DeepSeek-V3 相同的稀疏注意力架构(DSA),这被行业视为一种极具性价比的演进策略。

  • 规模跨越:总参数量飙升至 745B,是前代 GLM-4.7 的 2 倍。
  • 计算效率:采用 Mixture-of-Experts (MoE) 机制,拥有 256 个专家,每次仅激活 8 个(约 44B 激活参数),稀疏度低至 5.9%,大幅降低了推理成本。
  • 能力补齐:支持最高 202K token 的上下文窗口,并重点强化了视频理解等多模态能力,弥补了此前纯文本架构在 2026 年市场需求下的短板。

Generated Image February 11, 2026 - 10_28AM (1).png

图源备注:图片由AI生成

行业影响与部署门槛

GLM-5 对 DSA 架构的采用具有深远的行业意义。它意味着该模型可以直接复用 vLLM、SGLang 等主流推理框架现有的优化方案。对于企业级用户而言,这直接降低了部署门槛和算力成本。在国产 AI 积极出海、与海外大模型贴身肉搏的浪潮中,智谱凭借 GLM-5 在性能与工程化上的双重突破,再次证明了其作为头部玩家的实力。

评论 (0)

暂无评论,快来发表第一条评论吧!

AI 技术峰会

2025 AI 技术峰会

AI 实战课程

AI 实战课程

热门工具

AI 助手

智能对话,提升效率

智能图像处理

一键美化,智能修图

AI 翻译

多语言实时翻译