不只是生成视频:谷歌 Veo3惊艳亮相，可自动玩数独、解迷宫

AI资讯1天前发布阿力

2 0 0

根据谷歌研究部门的最新披露，其视频生成模型Veo3在视觉AI领域取得了突破性进展，被誉为达到了“GPT-3”时刻。在对Veo3进行了一系列测试后，研究人员发现，该模型不仅限于视频生成，还能在无需额外训练的情况下，自动完成多项复杂的视觉任务。

在用18，384个最简单的视频生成任务进行测试时，Veo3展示出惊人的多功能性，包括寻找物体、修复照片、玩迷宫、解决数独等。具体来说，Veo3能够:

理解图像:自动识别图像中的边缘、轮廓、物体位置、颜色和形状等基本视觉元素。
理解物理原理:具备基本的物理认知，例如能够分辨出哪些物体会漂浮，哪些会下沉，并理解光的反射方式。
进行手动编辑:像“自动版Photoshop”一样，Veo3可以执行复杂的图片编辑任务，如去除背景、添加文字，甚至将照片转换为油画风格。
具备“理性”能力:在面对迷宫图像时，它能够自主规划并绘制出穿过迷宫的路径。

谷歌研究部门认为，Veo3的这一突破标志着视觉AI领域进入了新的发展阶段，其通用性和自主任务解决能力堪比自然语言处理领域的GPT-3。

# AI资讯 # GPT-3 # Veo3 # 视觉AI # 视频生成模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Google Veo 3 FAST/TURBO模式上线！五倍性价比，AI视频生成进入“超速”时代！

阿力

41 0

NGoogle 研究显示：Veo 3视觉处理能力迎来“GPT-3”时刻

阿力

0 0

字节的新AI视频模型 Waver 1.0 发布，支持多种艺术风格的视频生成

阿力

12 0

谷歌通过 Gemini 应用扩展了其热门新视频机型 Veo 3 的访问权限

阿力

54 0

谷歌Veo 3视频生成模型向 Pro / Ultra 会员开放，将新增“照片生成视频”功能

阿力

34 0

NDeepMind 重磅推出 “帧链” 概念：视频模型或将实现全面视觉理解

阿力

1 0

暂无评论

暂无评论...

OneNav 一为导航主题，集网址、资源、资讯于一体的 WordPress 导航主题，简约优雅的设计风格，全面的前端用户功能，简单的模块化配置，欢迎您的体验

友链申请免责声明广告合作关于我们

Copyright © 2025 AI星球由 OneNav 强力驱动