电话: +86-755-26032463 邮编: 518055
中国深圳西丽深圳大学城哈工大校区L栋
4月19日精彩回顾
● 主旨报告
4月19日上午8:30,腾讯首席科学家、腾讯AI Lab及腾讯Robotics X实验室主任张正友教授作了题为“数字人:虚实集成世界的具身智能体”的主旨报告。介绍近几年在数字人的AI生成、重建和驱动,数字人对话,真人-数字人全双工交互,数字人游戏解说等方面的工作。


张正友教授作主旨报告
● 主旨报告
4月19日上午9:15,特拉维夫大学教授Daniel Cohen-Or作了题为“Challenges in Large-scale Text-to-Image Models: Personalization and Style Control”的主旨报告。深入探讨了文本反转的概念,并探索注意力机制以及旨在有效管理T2I模型中的风格和内容的各种技术。


Daniel Cohen-Or教授作主旨报告
● 数字人论坛
4月19日上午10:30,中国科学技术大学数学科学学院张举勇教授和天津大学李坤教授主持了数字人论坛,李坤教授作了数字人年度进展报告。慕尼黑工业大学Angela Dai助理教授、浙江大学金小刚教授、北京大学刘利斌助理教授 、北京大学连宙辉副教授、MSRA杨蛟龙研究员、小冰公司技术副总裁王宝元分别作了题为“Bringing 3D Scenes to Life: Learning to Model Humans in their Natural Environments”、“数字人建模动画关键技术及其应用索之路”、“数字人肢体动作的高质量表达与生成”、“个性化数字人的便捷构建”、“有情感表达能力的交互式高保真数字人初探”、“基于数字人内容创造和交互应用的技术探索与实践”的报告。

● SLAM与空间计算论坛
4月19日下午14:00,浙江大学章国锋教授、中科院自动化所申抒含研究员主持了 SLAM与空间计算论坛,申抒含研究员作了 SLAM与空间计算年度进展报告。深圳大学黄惠教授、国防科技大学徐凯教授、北京大学施柏鑫副教授、西北工业大学杨佳琪副教授、浙江大学崔兆鹏研究员、中山大学郑伟诗教授分别作了题为“Exploring the Digital Urban Landscape: Capture, Reconstruction, and Generation”、“鲁棒可扩展的实时三维重建——优化与学习”、“实拍数据集在三维视觉与空间计算研究中的作用——以光照恢复形状为例”、“航天三维重建应用中的几何匹配问题研究”、“基于神经隐式表达的空间定位与构图”、“机器人视觉行为分析中的三维点云信息处理与建模”的报告。

● 青年新星论坛
4月19日下午16:40,国防科技大学郭裕兰副教授、北京理工大学武玉伟副教授主持了青年新星论坛。南京大学姚遥副教授、浙江大学廖依伊研究员、浙江大学彭思达研究员、上海交通大学晏轶超助理教授、斯坦福大学博士后徐英豪、新畅元科技首席算法科学家郑泽荣、北京大学陈文拯助理教授、北京大学孙赫助理教授、腾讯AI Lab胡文博研究员、IDEA曾爱玲研究员、之江实验室PI兼浙江大学研究员徐晓刚、北京师范大学张鸿文副教授、国防科技大学施逸飞副教授、香港中文大学(深圳)陈冠英助理教授、中科院计算所杨洁研究员、KAUST张彪研究员、西北工业大学惠乐副教授、OPPO美国研究院高级科学家李众分别作了题为“高真实感多视点三维重建”、“面向自动驾驶的高写实仿真:从重建到生成”、“无需特征检测的图像匹配”、“三维数字人的重建、编辑与驱动”、“Large Gaussian Reconstruction Model for Efficient 3D Reconstruction and Generation”、“基于高斯Splatting的数字化身建模”、“动态场景的表征和成像”、“三维科学成像:从太空到细胞”、“Anti-Aliasing in Neural Rendering”、“大规模三维人物数据搭建及相关生成算法的进展”、“针对真实世界降质数据的高效神经辐射场”、“移动相机下脚地交互合理的单目实时全身运动捕捉”、“几何结构驱动的机器人感知与交互”、“面向文生三维的可泛化法线-深度扩散模型”、“具有复杂拓扑的开曲面重建和生成方法”、“Exploring Representations for 3D Generative Models”、“基于超点表示的三维场景理解方法研究”、“基于时空特征的实时动态高斯Splatting”的报告。
● 远程特邀报告
4月19日晚上19:30,CMU 计算机科学学院的助理教授Jun-Yan Zhu作了题为“Data Ownership in Generative Models”的报告,首先介绍了用于从预训练的文本到图像扩散模型中移除受版权保护的资料、在世艺术家的艺术风格和记忆图像的方法。然后,讨论数据归因算法以评估每个训练图像对生成样本的影响,让创作者能够保留对训练图像所有权的控制。


远程特邀报告
● 优秀学生论坛
4月19日晚上20:00,香港中文大学韩晓光助理教授、浙江大学彭思达研究员主持了优秀学生论坛。华为方杰民、香港大学龙霄潇、北京大学吴睿海、UC Berkeley王倩倩、南洋理工大学蔡中昂、蒙特利尔大学刘圳、清华大学李哲、香港中文大学徐霖宁分别作了题为“基于Gaussian Splatting的3D/4D内容重建和生成”、“基于跨域生成模型的单目三维重建”、“具身智能中物体操作的视觉表征”、“基于单目视频的运动信息恢复与动态场景重建”、“动作捕捉与动作生成的相遇还有多远?”、“三维表征与非水密网格的重建与生成”、“Animatable Gaussians:基于3D Gaussian Splatting的可驱动数字人体化身”、“Multiverse Reality: 基于神经辐射场技术的高逼真虚拟现实场景”的报告。随后,还展开了主题为“在当前这个'卷'时代,做科研要不要追热点”的非正式辩论赛。
4月20日精彩回顾
● 开幕式


北京大学陈宝权教授在开幕式上致辞
● 主旨报告
4月20日上午9:00,慕尼黑工业大学Matthias Nießner教授作了题为“Photo-realistic AI Avatars”的主旨报告,介绍在创建逼真的人工智能头像方面的最新研究,研究主要目标是创建在视觉上与真人照片和视频无异的虚拟角色。此外,还希望通过动画、文字或语音等多模式控制信号来控制这些头像,从而复制现实世界中的对话,并利用头像进行三维内容创作。最终的目标是见证照片和视频进化为交互式全息三维内容,与物理现实无异。


Matthias Nießner教授作主旨报告
● 3DV与世界战略模型论坛
4月20日上午10:20,中国科学技术大学刘利刚教授、肯塔基大学杨睿刚教授主持了3DV与世界战略模型论坛以及Panel讨论,北京大学陈宝权教授、上海科技大学虞晶怡教授、上海AI Lab乔宇教授分别作了题为“从图形计算到4D AIGC到具身智能”、“Emerging Foundation Models for Embodied AI”、“书生多模态大模型:进展与展望”的报告。MSRA研究主管童欣、UCSD苏昊副教授、UT-Austin黄其兴副教授围绕3DV与世界战略模型这个主题,从不同角度展开探讨,碰撞思想,以促进产生一些新的思想,达成研究方向、技术应用上的共识,推动相关领域的研究进展及产学研合作。

● 三维大模型论坛
4月20日下午13:40,北京大学陈文拯、香港科技大学(广州)陈颖聪助理教授主持了三维大模型论坛,陈颖聪助理教授作了三维大模型年度进展报告。上海AI Lab欧阳万里主任、香港中文大学(深圳)韩晓光助理教授、VAST曹炎培、香港大学赵恒爽助理教授、UCSD苏昊副教授、UT-Austin黄其兴副教授分别作了题为“3D大模型的探索之路”、“Sora之下,AIG-3D 还要不要卷?”、“VAST在三维表示和神经网络架构方面的探索”、“Exploring Pathways to 3D Foundation Models”、“可交互性和可控性更强的3D基础模型”、“LEAP: Liberate Sparse-view 3D Modeling from Camera Poses”的报告。

● 具身智能论坛
4月20日下午16:10,国防科技大学徐凯教授、深圳大学胡瑞珍教授主持了三维大模型论坛,胡瑞珍教授作了具身智能年度进展报告。中山大学林倞教授、清华大学弋力助理教授、北京大学王鹤助理教授、清华大学许华哲助理教授、中科院计算所蒋树强研究员分别作了题为“面向通用具身导航的高效数据生成与构建”、“基于人类行为仿真的可泛化人机协作”、“三层级具身三维多模态大模型系统”、“高效泛化的灵巧手操作“、“具身智能中的视觉导航”的报告。


专题讨论
4月20日晚宴,评选出了本次大会的优秀学生论坛讲者:刘圳、李哲、王倩倩、吴睿海、龙霄潇、徐霖宁、方杰民、蔡中昂。

4月21日精彩回顾
● 主旨报告
4月21日上午8:30,香港科技大学权龙教授作了题为“From 3D Reconstruction to 3D Generation: a Panorama of Deep Learning and Computer Vision of Today”的主旨报告。在报告中首先重温计算机视觉的确定性几何方法,然后介绍三维、视频和图像视觉的概率和生成方法。最后,从生成未来的角度展开了讨论。


权龙教授作主旨报告
● 视频生成论坛
4月21日上午9:35,MSRA研究主管童欣、北京大学穆亚东副教授主持了视频生成论坛,穆亚东副教授作了视频生成年度进展报告。通义实验室XR团队负责人薄列峰、浙江大学杨易教授、腾讯科学家单瀛、新加坡国立大学 Zheng Mike, Shou助理教授、香港大学罗平副教授、香港科技大学陈启峰助理教授分别作了题为“人物视频生成新范式探索”、“多重知识驱动的数字人生成技术”、“视频生成的探索和实践”、“视频生成,从视觉先验学起”、“Efficient Diffusion Transformer for Image and Video Generation”、“探索AI驱动的通用视频生成与编辑”的报告。


● 企业报告
4月21日上午11:25,合作商代表分别介绍了各自企业的情况以及3DV技术在工业界落地应用的进展,奥比中光三维重建组负责人徐玉华、华为主任工程师冯文森分别作了题为”从大范围深度感知到0.02mm精度3D扫描“、”华为三维视觉技术挑战介绍“的报告。
● 3DGS-NeRF论坛
4月21日下午13:30,哈尔滨工业大学张盛平教授、中科院计算所高林研究员主持了3DGS-NeRF论坛,高林研究员作了3DGS-NeRF年度进展报告。清华大学刘烨斌教授、浙江大学周晓巍研究员、香港大学齐晓娟助理教授、上海科技大学许岚助理教授、西北工业大学戴玉超教授、浙江大学许威威教授分别作了题为“3D高斯动态重建与生成”、“大规模动态场景的重建与渲染”、“Learning to Reconstruct, Understand, and Synthesize the 3D World”、“神经渲染和体积视频的一些思考”、“3D Geometry-aware Deformable Gaussian Splatting for Dynamic View Synthesis”、“三维内容的神经隐式表达构建技术探讨”的报告。

● 大场景与自动驾驶论坛
4月21日下午15:40,中科院自动化所吴毅红研究员、北京通用人工智能研究院科学家黄思远主持了大场景与自动驾驶论坛,黄思远作了大场景与自动驾驶年度进展报告。北京科技大学马惠敏教授、嬴彻科技杨睿刚教授、上海AI Lab青年科学家李弘扬、华中科技大学陶文兵教授、上海AI Lab青年科学家戴勃、厦门大学王程教授、朗歌科技副总经理李战斌分别作了题为“认知启发的自动驾驶三维场景理解”、“Adapting Big Model for Autonomous Driving -- an industry perspective”、“Towards General and Intelligent Autonomous Agent and System”、“多视图三维重建”、“LandMark2.0--更低算力需求的城市级实时渲染和编辑”、“基于激光雷达三维视觉的全球定位”、“朗歌智驾地图与多模态大模型”的报告。

● 闭幕式
此外,大会组委会对合作商表达了感谢。铂金合作商有奥比中光;金牌合作商有朗歌科技、腾讯 AI Lab、OPPO、华为;银牌合作商有图漾科技、新畅元、真格基金、先临三维,参展合作商有并行、维真显示。
最后,西北工业大学戴玉超教授对大会进行了致辞总结,对承办方表示感谢,宣布会议圆满结束,并预告明年大会将在西安举办。会后,所有组织者及志愿者合影留念。
● 哈尔滨工业大学(深圳)主办方 iLearn 合影
![]()

