每日AI资讯0802:Agent协同作战、AI编程革新与多模态模型全面升级

匿名作者
2025-08-02 10:5746

导语:今日AI界风起云涌,从Manus AI推出百个Agent协同工作的“Wide Research”功能,到字节跳动Trae代码编辑器集成OpenAI o3模型,AI的应用边界正被以前所未有的速度拓宽。Poe平台全面开放API,Claude支持多格式文件上传,Creao AI获千万美元融资打造“Agent协同操作系统”,AI开发与协作的门槛持续降低。底层技术同样迎来突破,DeepSeek公布大模型部署新专利,清华大学开源MOSS-TTSD语音合成模型。此外,AI在机器人领域的应用也结出硕果,字节跳动助力清华大学夺得机器人足球世界杯冠军。与此同时,马斯克Grok推出的6秒AI视频生成功能也引发了新的社会讨论。

Manus AI开启百“人”斩:一键启动百个Agent协同,复杂任务轻松搞定

Manus AI 近日推出了其上线以来最大的一次功能更新——“Wide Research”。该功能允许用户一键启动大规模并行的Agent协作,轻松处理过去难以想象的复杂调研任务,例如在短时间内对比分析上百款运动鞋或为一张海报寻找海量设计灵感。这一强大的功能将逐步向平台各层级用户开放,其核心是一种源于MapReduce范式的系统级并行计算机制,标志着AI协同工作进入了新纪元。

image.png

字节跳动Trae代码编辑器再进化,集成OpenAI o3模型解锁编程新范式

字节跳动旗下的AI代码编辑器Trae现已正式支持OpenAI最新发布的o3模型。得益于o3模型强大的推理能力和独特的“思考式”问题解决机制,Trae在代码生成、上下文感知调试以及多工具协同等方面的能力得到了巨大提升。这不仅显著提高了开发者的工作效率,更引领了AI辅助编程的新标杆。同时,Trae承诺将严格保障用户的隐私与数据安全,让开发者可以安心使用。

image.png

Poe平台开放API,订阅即享全能模型,开发者迎来新福音

AI聊天平台Poe近日宣布推出API功能,为其发展历程增添了重要里程碑。此举意味着所有订阅用户无需支付额外费用,即可通过API调用平台上的全部文本、图像、视频模型及机器人。更具吸引力的是,该API兼容OpenAI接口,极大地降低了开发者的使用和迁移门槛,为加速AI技术的集成与应用铺平了道路,标志着Poe正式向开发者工具平台转型。

image.png

DeepSeek公布大模型部署新专利,预填充与解码分离优化效率

DeepSeek的关联公司最近公开了一项关于大语言模型部署的创新专利。该技术的核心思想是将模型的预填充(pre-filling)和解码(decoding)两个阶段分别部署在不同的高性能计算设备上。这种创新的部署方式旨在优化计算资源利用率,有效降低延迟,同时提高系统的吞吐量、扩展性和容错性,有望推动AI技术的进一步发展,并加速各行各业的数字化转型进程。

image.png

Creao AI获千万美元融资,旨在打造下一代“Agent协同操作系统”

人工智能初创公司 Creao AI 近日宣布,已连续完成数百万美元的天使轮和数千万美元的Pre-A轮融资。公司的核心目标是开发一个以AI Agent为核心的下一代操作系统——Agentic OS(AOS)。该系统旨在通过一次简单的对话,就能自动生成并部署一个功能完整的全栈Agentic App,实现从应用生成到自我进化的一站式智能协作,有望重塑用户与智能系统的交互方式,甚至深刻改变整个软件产业。

image.png

Claude“神器”再升级,支持多格式文件上传,实现数据与AI无缝协作

Claude的artifacts功能迎来重磅升级,现已支持用户上传PDF、图像、代码等多种格式的数据文件。用户可以将这些文件无缝集成到AI驱动的应用中,极大地提升了数据处理和AI应用开发的灵活性与效率。无论是分析复杂的文档,还是从图像中提取信息,这项升级都为用户解决实际问题提供了前所未有的强大工具。该功能背后由Claude4、Claude 3.7 Sonnet和Claude 3.5 Sonnet等先进AI模型提供技术支持。

image.png

清华大学开源MOSS-TTSD,百万小时训练打造双语AI播客新标杆

由清华大学等机构联合研发的MOSS-TTSD模型现已震撼开源。这是一款在对话场景下实现中英双语高表现力语音合成的AI模型,通过创新的XY-Tokenizer技术,支持超长语音生成、零样本音色克隆以及声音事件控制。该模型特别适用于AI播客、有声小说和影视配音等长篇内容的创作。尽管在语气和节奏感上略逊于商业产品,但其开源免费的特性和在中文客观指标上的优异表现,使其拥有巨大的应用潜力。

image.png

字节跳动与清华大学联手,AI算法助力中国队首夺机器人足球世界杯冠军

在刚刚结束的2025 RoboCup机器人世界杯人形组比赛中,清华大学火神队历史性夺冠,这是中国队首次在该项目上获得胜利。此次胜利的背后,离不开字节跳动Seed团队与清华大学联合研发的“HumanoidKick”算法。该算法通过先进的视觉深度强化学习技术,成功解决了机器人足球在感知与执行层面的核心难题,展现出卓越的实时响应和自主决策能力,成为推动机器人技术发展与应用的一次成功范例。

image.png

马斯克的Grok进军视频生成,新功能可创作6秒AI短片

马斯克旗下的xAI公司为其AI聊天机器人Grok推出了一项名为“Imagine”的新功能,允许用户根据文本提示生成带有声音的6秒钟视频片段。该功能计划于今年十月正式上线。然而,这一功能也引发了公众对于深度伪造、内容剥削以及潜在偏见(如反犹太主义)等问题的广泛担忧,尤其是在其先前已推出性别化AI伴侣的背景下,相关的争议和社会讨论正在升温。

image.png

评论 (0)

暂无评论,快来发表第一条评论吧!