今日AI界风起云涌,马斯克旗下xAI将苹果与OpenAI告上法庭,指控其垄断行为。同时,一种利用图像重采样技术的新型AI攻击方式被揭露,为安全领域敲响警钟。各大科技巨头则竞相发布创新工具:字节跳动内测3D模型生成器,谷歌NotebookLM解锁80种语言,微软与阿里分别开源超长语音合成及视频修复模型,腾讯推出游戏AI大模型大幅提升动画制作效率。这些进展预示着AI技术在应用层面正迎来新一轮的爆发。
巨头之争 xAI正式起诉苹果与OpenAI
埃隆·马斯克创立的xAI公司已在美国联邦法院对苹果和OpenAI提起诉讼。诉讼指控两家公司通过签订排他性协议,非法合谋阻碍人工智能领域的公平竞争。此举不仅限制了xAI等公司的发展空间,还直接损害了其应用Grok在苹果平台上的展示机会。
无形攻击 AI模型爆出新漏洞,图像竟成特洛伊木马
研究人员发现了一种全新的AI攻击方式。攻击者可以利用图像重采样技术,将恶意指令嵌入到人眼无法察觉的图像之中。当AI系统处理这些被篡改的图像时,隐藏的指令便会激活,从而劫持大语言模型,导致用户数据被窃取等严重后果。
人人都是建模师 字节跳动内测“3D模型生成器”
字节跳动豆包团队正在内部测试一款名为“3D Model Generator”的全新工具。该工具能根据用户上传的图像直接生成3D模型,旨在大幅降低3D建模的技术门槛,为游戏开发等领域提供高效的3D资产创建方案。
打破语言壁垒 谷歌NotebookLM支持80种语言并新增视频转换功能
谷歌旗下的学习工具NotebookLM迎来重磅升级,现已全面支持80种语言。此次更新还革命性地推出了视频概览功能,用户可以将笔记、PDF和图片一键转换为多语言视频演示文稿,彻底打破了过去仅支持英语的局限,极大地扩展了其作为全球学习助手的能力。
90分钟超长语音一键生成 微软开源VibeVoice-1.5B模型
微软研究院近日开源了其最新的VibeVoice-1.5B音频模型。该模型在语音合成技术上取得了重大突破,能够一次性生成长达90分钟的超长语音,且保证了音色的自然稳定与语义的连贯。此外,它还支持多达四位发言人的多说话人合成,性能远超以往模型。
视频修复神器 阿里云开源Vivid-VR解决闪烁抖动难题
阿里云正式开源了视频修复工具Vivid-VR。该工具利用生成式AI与T2V模型,并结合了ControlNet技术,能够高效解决视频中常见的闪烁、抖动等问题,确保帧间内容的高度一致性,为内容创作者们带来了更高质量、更便捷的视频修复解决方案。
告别爆肝 腾讯游戏AI大模型4秒生成200帧动画
腾讯游戏发布了其专业的游戏AI大模型,该模型在动画制作领域取得了惊人突破。现在,仅需短短4秒钟,AI便能自动生成200帧的流畅动画,将动画师从繁重的工作中解放出来,效率提升高达8倍。
编程新哲学 Karpathy提出三层AI编程结构
著名AI专家Andrej Karpathy提出了最新的“氛围编程”指南,他建议为不同的编程场景选择最合适的AI工具。这套三层结构为 顺境时使用Cursor,逆境时求助Claude,而绝境中则依赖GPT-5 Pro。这一理念强调了在AI时代,为不同任务选择最适宜的模型,已成为一种需要深思熟虑的艺术。
相关推荐

2025 AI 技术峰会

AI 实战课程
热门工具
AI 助手
智能对话,提升效率
智能图像处理
一键美化,智能修图
AI 翻译
多语言实时翻译
评论 (0)
暂无评论,快来发表第一条评论吧!