国产大模型赛道在 2026 年春节期间迎来高光时刻。GLM-5 的发布不仅在技术路线上验证了稀疏注意力架构的可行性,更在资本市场上演了一场造富神话。
马甲曝光后的资本狂欢
继 DeepSeek 之后,智谱 AI 的新一代大模型 GLM-5 成为了市场的绝对焦点。这一动作直接引爆了资本市场,导致智谱股价近期大涨 200%,总市值冲破 1500 亿港币大关,达到其 IPO 时的 3 倍。
此前,全球模型服务平台 OpenRouter 上出现了一款代号为“Pony Alpha”的神秘模型,其代码编写能力直逼行业顶尖的 Claude Opus。经过网友对其特有逻辑 Bug(如特定且异常的烹饪问答)的“指纹识别”,以及系统提示词的自曝,该模型的真实身份最终被确认为 GLM-5。
复用 DSA 架构的参数跃升
在技术路线上,GLM-5 选择了与 DeepSeek-V3 相同的稀疏注意力架构(DSA),这被行业视为一种极具性价比的演进策略。
- 规模跨越:总参数量飙升至 745B,是前代 GLM-4.7 的 2 倍。
- 计算效率:采用 Mixture-of-Experts (MoE) 机制,拥有 256 个专家,每次仅激活 8 个(约 44B 激活参数),稀疏度低至 5.9%,大幅降低了推理成本。
- 能力补齐:支持最高 202K token 的上下文窗口,并重点强化了视频理解等多模态能力,弥补了此前纯文本架构在 2026 年市场需求下的短板。
行业影响与部署门槛
GLM-5 对 DSA 架构的采用具有深远的行业意义。它意味着该模型可以直接复用 vLLM、SGLang 等主流推理框架现有的优化方案。对于企业级用户而言,这直接降低了部署门槛和算力成本。在国产 AI 积极出海、与海外大模型贴身肉搏的浪潮中,智谱凭借 GLM-5 在性能与工程化上的双重突破,再次证明了其作为头部玩家的实力。
相关推荐

2025 AI 技术峰会

AI 实战课程
热门工具
AI 助手
智能对话,提升效率
智能图像处理
一键美化,智能修图
AI 翻译
多语言实时翻译






评论 (0)
暂无评论,快来发表第一条评论吧!