每日AI资讯1110:GPT-5 编程模型发布,Kimi K2 成本引爆行业,文心5.0文本能力登顶

匿名作者
2025-11-10 10:32100

导语:今日AI界迎来多项重磅突破,从OpenAI推出专为开发者设计的GPT-5-Codex-Mini编程模型,到月之暗面Kimi K2以极低成本实现性能登顶,再到阿里Qwen3与文心5.0分别在数学和文本能力上展现卓越实力。此外,音频编辑和出行安全领域也迎来了AI技术的创新应用。

编程界迎来新风暴 OpenAI 发布 GPT-5-Codex-Mini

OpenAI 近日发布了专为开发者设计的 GPT-5-Codex-Mini 编程模型。该模型基于先进的 GPT-5 架构,在代码推理和生成能力上实现了显著飞跃。无论是创建新项目、扩展现有功能,还是编写单元测试和进行大规模代码重构,GPT-5-Codex-Mini 都能高效处理。在权威的 SWE-bench 基准测试中,它以74.5%的高分超越了所有前代模型,展现了其强大的编程实力。

image.png

图源备注:图片由AI生成

音频编辑进入“令牌时代” StepFun AI 开源新模型

StepFun AI 公司最新推出了一个开源的3B参数模型 Step-Audio-EditX,为音频编辑领域带来了革命性的体验。该模型创新地将复杂的音频编辑流程转化为类似文本编辑的“令牌”操作,用户可以像修改文字一样直接、可控地编辑语音。这一技术有效克服了现有文本转语音(TTS)系统在情感和风格控制上的短板,让充满表现力的语音编辑过程变得前所未有的简便与精确。

image.png

图源备注:图片由AI生成

AI成本革命 月之暗面 Kimi K2 训练成本仅460万美元

国产AI独角兽月之暗面再次成为焦点,其发布的 Kimi K2 Thinking 模型训练成本被曝仅为460万美元,却在被誉为“人类终极考试”的HLE基准测试中,以44.9%的惊人得分超越了包括 GPT-5 在内的众多国际顶尖闭源模型。这一成就不仅展示了 Kimi K2 极高的性价比,更预示着AI大模型领域的成本革命已经到来,低成本、高性能将成为新的竞争焦点。

image.png

图源备注:图片由AI生成

阿里Qwen3-Max-Thinking 登顶全球数学竞赛

阿里巴巴的AI推理模型 Qwen3-Max-Thinking 迎来了重大升级,并在全球顶级数学竞赛中取得了辉煌战绩。该模型在美国数学考试(AMC)和哈佛-麻省理工数学锦标赛(HMMT)中均获得满分,这是中国AI模型首次在这两项高难度竞赛中达到100%的准确率。这一突破充分彰显了 Qwen3 在复杂数学推理和抽象问题解决方面的强大能力,成功挑战了 OpenAI 在该领域的领先地位。

image.png

图源备注:图片由AI生成

文心5.0文本能力登顶 LMArena 最新排名出炉

在最新的 LMArena 全球大模型竞技场排名中,百度文心 ERNIE-5.0-Preview-1022 模型表现卓越,成功登顶国内文本能力榜首,全球排名第二。该模型在创意写作、深度对话和复杂问题理解等方面的表现尤为突出,获得了用户和评测系统的高度评价。这标志着中国自研大模型技术再次实现关键突破,在全球AI竞争格局中占据了重要一席。

image.png

图源备注:图片由AI生成

AI守护出行安全 滴滴顺风车严打“私下拼车”

为了提升乘客的出行安全,滴滴顺风车平台上线了名为“独享守护”的全新AI监管措施。该智能模型能够通过实时分析车辆的行程轨迹、司乘的沟通记录以及异常接单信息,精准识别绕行、异常停留等违规行为。此举旨在有效打击“私下拼车”等存在安全隐患的行为,为选择“独享”服务的乘客提供全程的安全保障。

image.png

图源备注:图片由AI生成

评论 (0)

暂无评论,快来发表第一条评论吧!

AI 技术峰会

2025 AI 技术峰会

AI 实战课程

AI 实战课程

热门工具

AI 助手

智能对话,提升效率

智能图像处理

一键美化,智能修图

AI 翻译

多语言实时翻译