英特尔研究院发布全新AI扩散模型可根据文本提示生成360度全景图

2023-06-25 11:11:49来源：科技头条

(相关资料图)

LDM3D是业界领先的可创建深度图的生成式AI模型，有望革新内容创作、元宇宙和数字体验

英特尔研究院宣布与Blockade Labs合作发布LDM3D(Latent Diffusion Model for 3D)模型，这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程(diffusion process)生成深度图(depth map)的模型，进而生成逼真的、沉浸式的360度全景图。LDM3D有望革新内容创作、元宇宙应用和数字体验，改变包括娱乐、游戏、建筑和设计在内的许多行业。

英特尔研究院人工智能和机器学习研究专家Vasudev Lal表示：“生成式AI技术旨在提高和增强人类创造力，并节省时间。然而，目前的大部分生成式AI模型仅限于生成2D图像，仅有少数几种可根据文本提示生成3D图像。在使用几乎相同数量参数的情况下，不同于现存的潜在扩散模型，LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计中的标准后处理方法相比，LDM3D能够为图像中的每个像素提供更精准的相对深度，并为开发者省去了大量用于场景开发的时间。”

封闭的生态系统限制了规模。英特尔致力于推动AI的真正普及，通过开放的生态系统让更多人从这项技术中受益。计算机视觉领域近年来取得了重大进展，特别是在生成式AI方面。然而，当今许多先进的生成式AI模型只能生成2D图像。与通常只能根据文本提示生成2D RGB图像的现有扩散模型不同，LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计(depth estimation)中的标准后处理(post-processing)方法相比，LDM3D在使用与潜在扩散模型Stable Diffusion几乎相同数量参数的情况下，能够为图像中的每个像素提供更精准的相对深度

关键词：英特尔研究院人工智能扩散模型文本提示生成360度全景图

英特尔研究院发布全新AI扩散模型 可根据文本提示生成360度全景图

推荐内容

英特尔研究院发布全新AI扩散模型可根据文本提示生成360度全景图