天天观察:苹果开发出“AI 建筑师”GAUDI,可根据文本生成超逼真 3D 场景

来源:东方资讯


【资料图】

美股研究社获悉,据雷锋网消息,如今,每隔一段时间就有新的文本生成图像模型释出,个个效果都很强大,每每惊艳众人,这个领域已经是卷上天了。

不过,像 OpenAI 的 DALL-E 2 或谷歌 的 Imagen 等 AI 系统,都只能生成二维图像,如果文字也能变成三维场景,那带来视觉体验势必加倍提升。

现在,来自苹果的 AI 团队推出了 3D 场景生成的最新神经架构 —— GAUDI。

它可以捕捉复杂和逼真的 3D 场景分布,从移动摄像机中进行沉浸式渲染,还能根据文本提示来创建 3D 场景。

GAUDI 的出现不仅会对许多计算机视觉任务上产生影响,而且其 3D 场景的生成能力也将有利于基于模型的强化学习和规划、SLAM 以及 3D 内容的制作等研究领域。

就目前来看,GAUDI 生成的视频质量还不算高,可以看出有很多伪影。不过,这个系统或许可以为苹果正在进行的渲染 3D 对象和场景的 AI 系统,这是一个好的开始和基础,据说 GAUDI 还将被应用到苹果的 XR 耳机中,用于生成数字化位置。

标签:

推荐

财富更多》

动态更多》

热点