取消
搜索历史
热搜词
原创
活动
产业创新
转型理念
ENI专访
当前位置:首页 >文章发布 > 正文
多模态AI下一步是3D内容生成
来源:财联社  作者: 佚名 2024-03-05 09:20:05
多模态内容生成展示了AIGC广阔的应用空间, 3D有望成为下一个实现突破的模态。

多模态内容生成展示了AIGC广阔的应用空间, 3D有望成为下一个实现突破的模态。

近期,一款名为DUSt3R的AI新工具火爆微软旗下GitHub平台,只需2张图片2秒钟就能完成3D重建,无需测量任何额外数据。这款AI工具才上线没多久就登上GitHub热榜第二。有网友实测,拍两张照片就重建出了他家的厨房,整个过程耗时不到2秒钟。

3D模型生成通常需要MVS估计相机参数,并在3D空间中对相应的像素进行三角测量。该产品同原来不一样的是,它是一种对任意图像进行3D立体重建的全新范式,不需要相机校准以及视点姿态等先验信息。从而可以实现提供两个以上图像的情况下,进行3D建模重建。

3D建模指的是使用软件来创建三维对象或形状的数学表示形式的过程。3D建模技术和3D模型广泛应用于医疗、游戏、影视、建筑、产品设计还是虚拟现实等领域。

AI+3D建模是利用人工智能技术,自动化地生成高质量的3D模型的过程。传统的3D建模需要艺术家花费大量时间和精力进行手工创作,而AI生成则通过训练机器学习算法,使计算机能够自动学习和生成3D模型,极大地提高了效率和准确性,同时降低了整个制作成本。

用户只需要输入关键词或者上传一张2D图片,这些工具就能在段时间内直接生成多个比较初步的3D模型,而用户满意的话,则可以选择进一步生成精度更高的3D模型。

当下的3D内容生成工具已经不少,目前海外在AI+3D技术上主要分为工业场景探索与非工业场景探索。非工业场景应用探索主要以谷歌的DreamFusion和英伟达的Magic3D为代表,主要面向游戏、元宇宙中的3D资产设计;工业场景应用则主要以衍生式设计软件为主,如PTC的Creo以及Autodesk的Fushion360均提供衍生式设计能力。

国内比较知名的3D生成AI模型包括:字节跳动研究团队开发的MVDream;由幻方量化旗下的一家大模型企业DeepSeek开发的DreamCraft3D;影眸科技从2016年开始进行人脸采集生成3D模型的业务。据该公司CTO张启煊介绍,其人脸生成3D的服务,应该是目前国内3D生成里面唯一一个走进游戏生产端的产品……

同一个prompt,最右侧是MVDream的成品

用户输入文本:“奔跑在树林中,搞笑的猪头和孙悟空身体的混合形像”,DreamCraft3D生成的内容

从ChatGPT代表的文生文,到DALL•E代表的文生图,再到Sora代表的文生视频,多模态已经成为了共识的AI发展趋势。中泰证券旗帜鲜明地提出,继文本、代码、图片、视频之后,下一个有可能实现突破的模态大概率是3D,“SORA之后的下一步:文生3D”。未来随着数字化的持续发展,3D资产数量的快速增长,3D建模的自动化生成或成为新的发展风口,而以各种大模型为代表的AIGC生产能力赋能3D建模,以及文生3D需求持续增长,都将促进AI赋能3D建模的快速发展。

不过AI+3D建模技术当前也面临较多挑战,如3D数据与资产缺乏、AI训练难度高、AI实时渲染技术有限、商业化落地难度大等问题。

免责声明:本文系网络转载,版权归原作者所有。本文所用图片、文字如涉及作品版权问题,请联系删除!本文内容为原作者观点,并不代表本网站观点。
编辑:乔帅臣
关键词:   AIGC  多模态AI  3D内容生成 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。