本期为TechBeat人工智能社区第539期线上Talk。
北京时间10月19日(周四)20:00,加州大学圣地亚哥分校博士生—刘明华的Talk已准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “在开放的世界中理解和生成3D物体”,探讨分享了开放世界中的3D物体生成及物体理解。
嘉宾:加州大学圣地亚哥分校博士生 刘明华
时间:北京时间 10月19日(周四) 20:00
地点:TechBeat人工智能社区
点击下方链接,即可观看视频!
在开放的世界中理解和生成3D物体是三维视觉和具身智能中的重要任务。随着大规模3D数据集的出现和VLM、LLM的发展,3D深度学习不再受限于数据的稀缺,迎来了新的机遇。曾经局限于少数类别的“椅子研究”开始探索面向开放世界的能力。
1、开放世界中的3D物体生成
(1)回顾过去一年3D AIGC的发展,总结各个流派的特点和问题。
(2)介绍一种较新的3D AIGC思路:有机结合多视角图像预测和三维重建。
(3)具体介绍我们NeurIPS2023的工作:One-2-3-45。
(4)列举与这一新思路相关的最新工作,并展望未来的探索空间。
2、开放世界中的3D物体理解
(1)简要介绍我们NeurIPS2023的工作:OpenShape。通过在大规模3D数据上进行多模态表征对齐,我们首次实现3D物体的开放世界理解,并支持丰富的三维点云应用。
(2)简要介绍我们CVPR2023的工作:PartSLIP。通过利用2D VLM,我们提出了一个对三维点云进行low-shot部件分割的新方法。其中zero-shot版本表现惊艳,few-shot版本能实现与全监督方法相近的性能。
▼
https://colin97.github.io/OpenShape/
https://colin97.github.io/PartSLIP_page
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
刘明华
加州大学圣地亚哥分校博士生
刘明华是加州大学圣地亚哥分校五年级博士生,导师为苏昊副教授。在此之前,他在清华大学计算机系取得本科学位。他的研究兴趣主要围绕于三维视觉和具身智能。他曾在CVPR、ECCV、SIGGRAPH、NeurIPS、CoRL等国际顶级会议和期刊发表17篇论文,其中一作、共一论文10篇。他曾在Adobe、Waymo、高通、商汤实习,曾荣获Powell奖学金和高通QIF奖学金。他曾多次担任CVPR、ECCV、ICCV、SIGGRAPH、NeurIPS、ICLR、ICML、T-RO、TPAMI等国际会议、期刊的审稿人。
个人主页:
https://www.techbeat.net/grzytrkj?id=34870
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区