每日AI资讯0806：开源浪潮再起，生成式AI全面开花

导语 OpenAI时隔五年重返开源，微软Azure迅速跟进，为开发者带来更灵活的模型选择；谷歌在可交互世界模型与AI笔记应用上取得新突破；百度则将AI能力具象化，推出数字员工；同时，AI在音乐创作、故事生成等领域的应用也日益成熟，但内容质量监管问题也随之而来。

开源新篇章 OpenAI五年后携免费模型强势回归

OpenAI近日发布了两款名为GPT-oss-120b和GPT-oss-20b的开源语言模型，打破了其长达五年的闭源传统。这两款模型性能强大，足以媲美部分付费产品，同时对硬件要求相对温和，并允许商业使用。此举标志着OpenAI向开源社区的战略性回归，旨在构建一个更加民主和开放的AI平台，以适应当前日益激烈的行业竞争格局。

强强联合微软Azure迅速引入OpenAI开源新模型

紧随OpenAI的开源步伐，微软宣布其Azure AI Foundry平台将正式引入GPT-oss系列模型。开发者和企业现在可以通过Azure AI Foundry及其Foundry Local服务，在云端或本地设备上自主运行、微调和部署这些强大的AI模型。这一举措极大地提升了AI应用的灵活性、可控性，并有效保障了数据隐私与安全，为企业构建和部署智能代理提供了统一且高效的解决方案。

虚拟世界一键生成谷歌Genie 3重新定义AI交互

谷歌DeepMind发布了革命性的世界模型Genie 3，它能够以每秒24帧的速度生成720P分辨率的可交互3D环境。用户不仅可以通过文本指令动态改变世界中的事件，还能体验到逼真的物理模拟。Genie 3的出现为AI智能体训练、沉浸式游戏开发、虚拟教育等领域开启了全新的可能性，预示着一个AI驱动的交互新纪元即将到来。

打工人新“同事” 百度智能云发布全球首批AI数字员工

百度智能云正式推出全球首批AI数字员工。这些数字员工深度融合了大模型、数字人技术以及行业知识（Know-How），具备“懂业务、给结果、可进化”的核心特性。它们能够胜任营销、客服、招聘、教培等多个核心业务职能，旨在显著提升企业的运营效率和生产力，标志着AI正从辅助工具向能够自主执行任务的“代理（Agentic）”时代迈进。

人人都是故事家谷歌Gemini推出AI故事书生成器

谷歌在其AI应用Gemini中新增了“Storybook”功能。用户仅需提供简单的故事情节，AI便能自动生成一本图文并茂的十页故事书，并支持多种视觉风格选择和语音朗读。尽管目前在角色形象一致性上仍有提升空间，但该功能极大地降低了内容创作的门槛，尤其在儿童教育和个性化阅读体验领域展现出巨大的潜力。

AI助力高效学习谷歌NotebookLM向青少年开放

为了帮助学生更深入地进行学习，谷歌的人工智能笔记应用NotebookLM现已向13岁以上的用户及所有教育用户开放。该应用能将用户上传的资料自动生成音频摘要、思维导图甚至视频演示文稿，极大地提升了学习和研究的效率。谷歌强调，平台将对未成年用户采取严格的内容安全策略，并承诺不使用用户上传的内容进行模型训练，以保护用户隐私。

AI变身音乐人 ElevenLabs推出商业音乐生成服务

AI初创公司ElevenLabs正式推出了其音乐生成服务Eleven Music。该服务允许用户通过简单的文本描述，快速生成包含人声和器乐的完整商业级音乐作品。为了确保训练数据的合法性，公司已与Merlin Network及Kobalt Music Group等机构达成合作。此举旨在为企业和内容创作者提供一个低成本、高效率的音乐创作解决方案。