每日AI资讯1201:GPT-5展现卓越数学能力 字节跳动重塑视频编辑

匿名作者
2025-12-01 11:5546

今日科技圈迎来多重震动,OpenAI 模型迭代大幅缩减科研时间,微软 Windows 11 深度集成 GPT-5.1 普惠用户。与此同时,字节跳动与快手在视频生成与理解领域展开激烈角逐,谷歌 TPU 新品发布引发算力市场价格战,多模态与硬件生态正加速重构我们的数字生活。

豆包手机助手技术预览版上线 携手努比亚开启系统级AI体验

豆包团队近期联合手机厂商,正式推出了基于大模型和系统底层授权的豆包手机助手技术预览版。这款助手旨在通过高效的交互方式和丰富的功能体验,改变用户与手机的互动模式。目前,首批搭载该技术的工程样机 nubia M153 已经面向开发者和技术爱好者进行了少量发售,预示着移动端原生 AI 时代的加速到来。

image.png

图源备注:图片由AI生成

谷歌推出 TPUv7 铁木处理器 挑战英伟达霸主地位

谷歌宣布推出代号为“铁木”的 TPUv7 处理器并正式对外销售,这一举措直接剑指英伟达在 AI 计算领域的市场垄断地位。随着新硬件的入场,AI 计算市场的价格战已初现端倪。据报道,OpenAI 通过采用该技术,成功节省了约 30% 的计算成本,这为大型模型训练的降本增效提供了新的思路。

image.png

图源备注:图片由AI生成

真假难辨 实验显示绝大多数人无法区分AI音乐

Deezer 与 Ipsos 联合进行的一项实验显示,高达 97% 的参与者无法准确分辨 AI 生成的音乐与人类创作的音乐。不过,该结论引发了一些争议,因为测试标准相对宽松,参与者只要猜错一首即被判定为“无法辨别”。尽管如此,这一数据依然反映出 AI 音乐生成技术在逼真度上已经达到了极高的水平。

image.png

图源备注:图片由AI生成

快手 Kling Omni 即将发布 打造导演级视频控制能力

快手科技宣布其多模态视频模型 Kling Omni 本周即将亮相。该模型不仅支持文本、图像和视频的混合输入,更具备了“导演级”的精准控制能力。它能够无缝融合视频生成与后期编辑,甚至可以生成长达 2 分钟且带有原生音频的长视频,旨在为创作者构建一个全能的创意宇宙。

image.png

图源备注:图片由AI生成

豆包 App 语音功能大升级 支持四种方言打破沟通壁垒

为了助力老年人跨越数字鸿沟,豆包 App 新增了基于方言迁移技术的语音对话功能。目前已支持粤语、四川话、东北话和陕西话四种方言。用户现在可以使用名为“温柔桃子”的音色,进行更加亲切、智能且流畅的方言交流,让科技产品变得更有温度。

image.png

图源备注:图片由AI生成

字节跳动 Vidi2 模型问世 120亿参数革新视频自动化编辑

字节跳动重磅推出了拥有 120 亿参数的视频理解模型 Vidi2。该模型的核心突破在于其精细的时空定位功能,能够处理长达数小时的原始视频素材,深刻理解故事脉络。它可以根据用户指令,自动化生成 TikTok 短视频或电影片段,这一技术有望彻底革新视频编辑领域的工作流程。

image.png

图源备注:图片由AI生成

GPT-5 展现卓越数学天赋 复杂科研任务几小时搞定

OpenAI 研究员布贝克分享了与 GPT-5 协作的惊人体验。他表示,该模型展现出了卓越的数学能力。原本需要花费研究人员一个月时间的复杂方案设计与模拟验证任务,GPT-5 仅用一个下午就高效完成了。这一案例生动展示了新一代大型语言模型在科研辅助领域的巨大潜力。

image.png

图源备注:图片由AI生成

Meta AI 推出 Matrix 框架 解决合成数据生成瓶颈

Meta AI 推出了全新的 Matrix 框架,旨在革新多智能体合成数据的生成方式。通过去中心化的设计,Matrix 将合成数据调度中的控制与数据流序列化为消息并进行分布处理。这种方法有效解决了传统中心控制器导致的 GPU 资源浪费和协调开销问题,显著提升了数据的新鲜度和多样性。

image.png

图源备注:图片由AI生成

微软 Win11 Copilot 免费解锁深度思考功能 集成 GPT-5.1

微软为 Windows 11 Copilot 用户推送了重磅更新,免费开放了 GPT-5.1 模型,并解锁了原付费功能“Think Deeper”深度推理。此外,更新还增设了“Labs”实验区,首批上线了实时画面解析组件,并计划在后续加入 3D 生成等更多前沿功能,极大地丰富了桌面 AI 体验。

image.png

图源备注:图片由AI生成

评论 (0)

暂无评论,快来发表第一条评论吧!

AI 技术峰会

2025 AI 技术峰会

AI 实战课程

AI 实战课程

热门工具

AI 助手

智能对话,提升效率

智能图像处理

一键美化,智能修图

AI 翻译

多语言实时翻译