导语 OpenAI时隔五年重返开源,微软Azure迅速跟进,为开发者带来更灵活的模型选择;谷歌在可交互世界模型与AI笔记应用上取得新突破;百度则将AI能力具象化,推出数字员工;同时,AI在音乐创作、故事生成等领域的应用也日益成熟,但内容质量监管问题也随之而来。
开源新篇章 OpenAI五年后携免费模型强势回归
OpenAI近日发布了两款名为GPT-oss-120b和GPT-oss-20b的开源语言模型,打破了其长达五年的闭源传统。这两款模型性能强大,足以媲美部分付费产品,同时对硬件要求相对温和,并允许商业使用。此举标志着OpenAI向开源社区的战略性回归,旨在构建一个更加民主和开放的AI平台,以适应当前日益激烈的行业竞争格局。
强强联合 微软Azure迅速引入OpenAI开源新模型
紧随OpenAI的开源步伐,微软宣布其Azure AI Foundry平台将正式引入GPT-oss系列模型。开发者和企业现在可以通过Azure AI Foundry及其Foundry Local服务,在云端或本地设备上自主运行、微调和部署这些强大的AI模型。这一举措极大地提升了AI应用的灵活性、可控性,并有效保障了数据隐私与安全,为企业构建和部署智能代理提供了统一且高效的解决方案。
虚拟世界一键生成 谷歌Genie 3重新定义AI交互
谷歌DeepMind发布了革命性的世界模型Genie 3,它能够以每秒24帧的速度生成720P分辨率的可交互3D环境。用户不仅可以通过文本指令动态改变世界中的事件,还能体验到逼真的物理模拟。Genie 3的出现为AI智能体训练、沉浸式游戏开发、虚拟教育等领域开启了全新的可能性,预示着一个AI驱动的交互新纪元即将到来。
打工人新“同事” 百度智能云发布全球首批AI数字员工
百度智能云正式推出全球首批AI数字员工。这些数字员工深度融合了大模型、数字人技术以及行业知识(Know-How),具备“懂业务、给结果、可进化”的核心特性。它们能够胜任营销、客服、招聘、教培等多个核心业务职能,旨在显著提升企业的运营效率和生产力,标志着AI正从辅助工具向能够自主执行任务的“代理(Agentic)”时代迈进。
人人都是故事家 谷歌Gemini推出AI故事书生成器
谷歌在其AI应用Gemini中新增了“Storybook”功能。用户仅需提供简单的故事情节,AI便能自动生成一本图文并茂的十页故事书,并支持多种视觉风格选择和语音朗读。尽管目前在角色形象一致性上仍有提升空间,但该功能极大地降低了内容创作的门槛,尤其在儿童教育和个性化阅读体验领域展现出巨大的潜力。
AI助力高效学习 谷歌NotebookLM向青少年开放
为了帮助学生更深入地进行学习,谷歌的人工智能笔记应用NotebookLM现已向13岁以上的用户及所有教育用户开放。该应用能将用户上传的资料自动生成音频摘要、思维导图甚至视频演示文稿,极大地提升了学习和研究的效率。谷歌强调,平台将对未成年用户采取严格的内容安全策略,并承诺不使用用户上传的内容进行模型训练,以保护用户隐私。
AI变身音乐人 ElevenLabs推出商业音乐生成服务
AI初创公司ElevenLabs正式推出了其音乐生成服务Eleven Music。该服务允许用户通过简单的文本描述,快速生成包含人声和器乐的完整商业级音乐作品。为了确保训练数据的合法性,公司已与Merlin Network及Kobalt Music Group等机构达成合作。此举旨在为企业和内容创作者提供一个低成本、高效率的音乐创作解决方案。
质量保卫战 维基百科严查AI生成内容
面对AI可能带来的低质量或虚假内容挑战,维基百科更新了其管理政策。新政策允许管理员在特定情况下,快速删除那些包含明显AI生成痕迹或引用错误的条目。此举旨在维护维基百科内容的准确性和可靠性,虽然这被视为一项临时性的应对措施,但也反映出在利用AI作为辅助工具的同时,内容平台的审慎态度。
历史性合作 OpenAI模型首次登陆亚马逊AWS
亚马逊云科技(AWS)平台首次正式上线了来自OpenAI的AI模型。这一举措被视为AWS在激烈的人工智能市场竞争中作出的积极回应。现在,全球大量的AWS用户将能更便捷地访问和使用OpenAI的先进模型,这无疑将进一步加速AI技术在各行各业的渗透与应用。
相关推荐

2025 AI 技术峰会

AI 实战课程
热门工具
AI 助手
智能对话,提升效率
智能图像处理
一键美化,智能修图
AI 翻译
多语言实时翻译
评论 (0)
暂无评论,快来发表第一条评论吧!