即日起,用户通过官网、App 或小程序进入对话界面,开启“深度思考”功能即可体验全新升级的 R1 模型!API 同步更新,调用方式不变。
🔍 深度思考能力:跨越式进化
本次升级基于 DeepSeek V3 Base(2024.12 基座),通过强化训练显著提升模型思维深度与推理能力。在数学、编程、逻辑等多项权威测评中,DeepSeek-R1-0528 综合表现领跑国内模型,并逼近国际顶尖水平(如 o3、Gemini-2.5-Pro)。
(基准测试:64K 输出长度 | Humanity's Last Exam 仅文本题目)
关键突破:
- 复杂推理飞跃:AIME 2025 测试准确率从 70% → 87.5%
- 思维深度倍增:单题平均思考量从 12K tokens → 23K tokens(解题更严谨周密)
- 开源模型赋能:蒸馏 R1 思维链训练的 DeepSeek-R1-0528-Qwen3-8B,在 AIME 2024 测试中: ✅ 超越原版 Qwen3-8B 达 10% ✅ 性能媲美 Qwen3-235B 大模型 → 为学术界与工业界小模型开发提供全新范本
(开源模型 AIME 2024 对比结果)
💻 前端开发:视觉与代码双重突破
实测 R1-0528 前端开发能力大幅领先 Claude4,生成代码布局美观、设计现代,效果差距显著:
▶️ 视频演示:R1 开发网页/App 全流程
🚀 全维度能力升级
1️⃣ 幻觉率降低 45~50%
优化改写、摘要、阅读等场景,输出更可靠
2️⃣ 创意写作进化
长文生成能力增强:议论文/小说/散文结构更完整,文风更自然
3️⃣ 工具调用(Function Calling)
- 支持非思考模式下工具调用
- Tau-Bench 性能比肩 OpenAI o1-high(airline 53.5% / retail 63.9%)
(LobeChat 调用示例:网页内容总结)
4️⃣ 角色扮演 & 前端生成再提升
(R1 开发单词卡片应用:现代简约风格)
⚙️ API 更新指南
- 接口与调用方式完全兼容旧版
- 新增支持:Function Calling / JSON 格式输出
- 重要调整:
max_tokens
现限制单次输出总长度(含思考过程) ▸ 默认值:32K ▸ 最大值:64K → 请开发者调整参数避免截断 🔗 使用文档:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model
📢 注:官网/App/API 仍提供 64K 上下文,需 128K 上下文可调用开源版本
🧠 模型开源
- 架构:同前代 R1(685B 参数,含 14B MTP 层)
- 训练优化:改进后训练方法,私有化部署仅需更新 checkpoint 与配置文件
- 开源版本:128K 上下文(MIT License 可商用)
- 下载地址: ▪️ Model Scope https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528 ▪️ Hugging Face https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
立即开启“深度思考”,体验更强大的 R1! 官网 | App | 小程序 | API 同步上线
优化说明:
- 强化标题层级:使用符号/加粗/分段提升可读性
- 突出核心数据:关键指标(87.5%→)视觉强化
- 用户引导明确:操作步骤(开启深度思考)前置+重复提示
- 技术表述简化:如“后训练过程”→“强化训练”,“思维链蒸馏”→功能化描述
- 视觉元素整合:图片/视频说明更简洁,避免中断阅读流
- API 变更高亮:重要调整(max_tokens)单独标注
- 增加行动号召:结尾强化体验入口
相关推荐

2025 AI 技术峰会

AI 实战课程
热门工具
AI 助手
智能对话,提升效率
智能图像处理
一键美化,智能修图
AI 翻译
多语言实时翻译
评论 (0)
暂无评论,快来发表第一条评论吧!