您的位置:首页资讯软件新闻 → Meta 推出 ViewDiff 模型:文本生成多视角 3D 图像

Meta 推出 ViewDiff 模型:文本生成多视角 3D 图像

时间:2024/4/15 13:31:10来源:www.pc6.com作者:路西蓝我要评论(0)

4月15日 消息:Meta 与德国慕尼黑工业大学研发出创新模型 ViewDiff,旨在帮助用户通过文本、图像或二者结合使用,快速生成高质量多视角3D 图像。

该模型解决了传统文本生成多视角3D 图像领域的三大难点:无法生成真实背景环境、图像质量和多样性不理想、缺乏多视角和一致性。通过引入一种创新架构,ViewDiff 采用文生成图模型作为先验知识和图像流生成器,再通过显式的3D 建模为图像赋予一致性和多视角能力。

为了有效捕获3D 几何和全局风格,研究人员对原有 U-Net 架构进行了创新,增强了跨帧注意力层和投影层。跨帧注意力层替换了标准自注意力层,实现跨图像风格匹配;而投影层将多视图2D 特征集成为显式的3D 体素特征,保证了输出图像的3D 几何一致性。在此基础上,ViewDiff 还开发了自回归生成模块,使其能在任意视角上生成更多的3D 一致性图像,进一步提升了模型的生成能力。

该研究的推出填补了文本生成多视角3D 图像领域的技术空白,有望为游戏开发、元宇宙等行业提供更便捷、高效的模型构建方案。该模型的推出不仅在技术层面上具有重大意义,也将为未来的3D 图像生成领域带来更多创新可能。


相关视频

    没有数据

相关阅读 Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型​Meta计划下周推Llama3基础版,夏季推出全面版​Meta将在Facebook和Instagram上标记AI生成的内容meta2智能眼镜怎么样 meta2智能眼镜评测腾讯等公司5000万美金投资Meta 美国AR创业公司Meta即将上市魅蓝Metal降价活动是什么 魅蓝Metal怎么限时优惠青葱metal手机怎么样 青葱metal手机配置魅蓝metal发布会视频直播地址

文章评论
发表评论

热门文章 滴滴和优步合并了吗 优​思源黑体:改变锤子手机发布会看点预TK域名免费注册及解析

最新文章 Meta 推出 ViewDiff 模InstantID团队推新风格 在线3D视频编辑工具使用地址 Lumiere官网地StableDesign:适用于室内装修设计的SD方案不止是音乐生成!Udio还可以创作喜剧、演讲iOS18或不包含苹果自研聊天机器人

人气排行 2020年放假安排时间表全年图 2020年法定节假2021年放假安排时间表全年图 2021年法定节假微信公众号怎么申请 微信公众号申请要钱吗zune怎么用?zune使用攻略!2014台式机装机配置推荐snmp协议在windows下的安装与配置微信朋友圈三天可见怎么破解 朋友圈仅展示三2016猴年邮票多少钱一套 2016猴年邮票价格表