AI资讯

DeepSeek-R1 更新,幻觉降低,思考更深,推理更强!

即日起,用户通过官网、App 或小程序进入对话界面,开启“深度思考”功能即可体验全新升级的 R1 模型!API 同步更新,调用方式不变。


🔍 深度思考能力:跨越式进化

本次升级基于 DeepSeek V3 Base(2024.12 基座),通过强化训练显著提升模型思维深度与推理能力。在数学、编程、逻辑等多项权威测评中,DeepSeek-R1-0528 综合表现领跑国内模型,并逼近国际顶尖水平(如 o3、Gemini-2.5-Pro)

img (基准测试:64K 输出长度 | Humanity's Last Exam 仅文本题目)

关键突破:

  • 复杂推理飞跃:AIME 2025 测试准确率从 70% → 87.5%
  • 思维深度倍增:单题平均思考量从 12K tokens → 23K tokens(解题更严谨周密)
  • 开源模型赋能:蒸馏 R1 思维链训练的 DeepSeek-R1-0528-Qwen3-8B,在 AIME 2024 测试中: ✅ 超越原版 Qwen3-8B 达 10%性能媲美 Qwen3-235B 大模型为学术界与工业界小模型开发提供全新范本

img (开源模型 AIME 2024 对比结果)


💻 前端开发:视觉与代码双重突破

实测 R1-0528 前端开发能力大幅领先 Claude4,生成代码布局美观、设计现代,效果差距显著:

▶️ 视频演示:R1 开发网页/App 全流程


🚀 全维度能力升级

1️⃣ 幻觉率降低 45~50%

优化改写、摘要、阅读等场景,输出更可靠

2️⃣ 创意写作进化

长文生成能力增强:议论文/小说/散文结构更完整,文风更自然

3️⃣ 工具调用(Function Calling)

  • 支持非思考模式下工具调用
  • Tau-Bench 性能比肩 OpenAI o1-high(airline 53.5% / retail 63.9%) img (LobeChat 调用示例:网页内容总结)

4️⃣ 角色扮演 & 前端生成再提升

img (R1 开发单词卡片应用:现代简约风格)


⚙️ API 更新指南

  • 接口与调用方式完全兼容旧版
  • 新增支持:Function Calling / JSON 格式输出
  • 重要调整max_tokens 现限制单次输出总长度(含思考过程) ▸ 默认值:32K ▸ 最大值:64K → 请开发者调整参数避免截断 🔗 使用文档:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

📢 注:官网/App/API 仍提供 64K 上下文,需 128K 上下文可调用开源版本


🧠 模型开源


立即开启“深度思考”,体验更强大的 R1! 官网 | App | 小程序 | API 同步上线


优化说明:

  1. 强化标题层级:使用符号/加粗/分段提升可读性
  2. 突出核心数据:关键指标(87.5%→)视觉强化
  3. 用户引导明确:操作步骤(开启深度思考)前置+重复提示
  4. 技术表述简化:如“后训练过程”→“强化训练”,“思维链蒸馏”→功能化描述
  5. 视觉元素整合:图片/视频说明更简洁,避免中断阅读流
  6. API 变更高亮:重要调整(max_tokens)单独标注
  7. 增加行动号召:结尾强化体验入口

相关推荐

评论 (0)

暂无评论,快来发表第一条评论吧!

AI 技术峰会

2025 AI 技术峰会

AI 实战课程

AI 实战课程

热门工具

AI 助手

智能对话,提升效率

智能图像处理

一键美化,智能修图

AI 翻译

多语言实时翻译

热门文章