标签归档:或许未来所有的3D特效技术都在这里了,300名三维视觉的高手齐聚一堂,青岛论剑

或许未来所有的3D特效技术都在这里了,300名三维视觉的高手齐聚一堂,青岛论剑 | 3DV 2017

雷锋网消息,2017年10月10日,3DV 2017国际会议在青岛香格里拉酒店正式召开,来自20多个多家的300多位计算机视觉界的研究人员齐聚一堂,开启了三维视觉研究一年一度的盛会。

(陈宝权教授开幕致辞)

开幕式中,山东大学计算机学院和软件学院院长陈宝权教授作为大会主席致辞。据陈宝权教授介绍,3DV国际会议此前由东京大学、斯坦福大学等举办,已经成为汇集三维视觉研究、原型系统、商业产品和人力资源等的盛会。

本届3DV会议首次在中国由山东大学主办,北京电影学院未来影像高精尖创新中心协办,共有来自20多个国家的300多位计算机视觉界的大咖们来此参会,论文投稿171篇,收录oral 论文12篇, spotlight 25篇, poster36篇。 

(微软雷德蒙研究院首席研究员张正友做特邀报告)

开幕式之后,首先由微软雷德蒙研究院首席研究员、ACM/IEEE Fellow张正友博士做了第一个特邀报告,报告主题为“三维计算机视觉在沉浸式交互和远程协作”。在报告中张正友博士介绍说,为了使人机交互以及人与人之间的远程协作更加自然,报告提出了沉浸式交互。张正友博士介绍了他的团队最新的研发成果,ViiBoard,这项技术集合了识别身体姿态、手势、面部表情、人体特征的技术于一身。ViiBoard主要包括ImmerseBoard与VTouch两个部分。他们通过Kinect采集信息,随后通过ImmerseBoard屏幕投影两位使用者实时书写与绘画的人像与内容。另外,该产品VTouch部分提供了特有的手势控制功能,使用户能够进行人性化的书写与绘画,同时记录不同的使用者手势习惯。最后,张正友讲述了融合三维重建,追踪人眼方向等技术的沉浸式交互技术的持续研发现状以及在三人远程协作技术中的应用。

(谜之微笑)

在下午场,由苏黎世大学的Davide Scaramuzza教授分享了基于事件相机的最新研究,报告主题为“从基于框架相机到基于事件相机,鲁棒性更高且能够进行视觉惯性状态评估”。传统的基于框架的相机在低光照和快速移动的情况下会严重地失真或模糊。相比来说,基于事件的相机,由于其输出为像素级亮度变化而不是传统的标准的强度帧,所以在高速运动场景下仍然能够提供非常可靠的视觉信息。不过基于事件的相机在低运动情况下可能仅输出少量信息。Davide教授在报告中提出了“hybrid pipeline”的方法,并将该方法应用到公开的事件相机数据集中,精度相比只使用事件pipeline提高了130%,相比于标准的框架视觉-惯性系统提高了85%。随后Davide教授展示了将该研究应用到四翼无人机上,效果非常完美,解锁了传统视觉-惯性测距仪无法达到的飞行情景,例如低光环境和高速动态场景。

(口头报告之一)

除了两场精彩的特邀报告外,四场口头报告也非常值得关注。它们分别为:(内容来自:山东大学交叉研究中心公众号「IRC」

上午场:

1、DepthSynth: Real-Time Realistic Synthetic Data Generation from CAD Modelsfor 2.5D Recognition

作者来自:西门子公司、西门子医疗、帕骚大学

作者提出了一个具有创新性的完全端对端的框架DepthSynth,模拟这些设备的工作原理,通过建模一些关键的因素例如传感器噪声,材料反射率,表面几何信息等等,进而生成逼真的深度数据。

2、Sparsity Invariant CNNs

作者来自:戴姆勒股份公司、弗莱堡大学和马克斯·普朗克研究所

对于传统的卷积网络在应用到稀疏数据时表现不佳的问题,研究人员提出了一个简单而有效的稀疏卷积层,它考虑了卷积过程中缺失数据的位置,能很好地推广到新的数据集,并且与数据稀疏程度保持不变,这无疑是机器学习与计算机视觉交叉方向的又一大创新。

下午场:

3、OctNetFusion: Learning Depth Fusion from Data

作者来自:格拉茨技术大学、微软、马克斯·普朗克研究所

将多个深度图进行融合,进行3D模型重建。常见的方法是基于平均截断的带符号距离函数,但是它不能有效地处理遮挡问题,并且需要大量帧来过滤噪声。随着3D模型库的增大,以及深度学习的发展,本文章提出了一种3DCNN方法将多深度的图像进行融合,重建3D模型,该方法解决了遮挡部位重建等问题,其结果明显优于TSDF和TV-L1等方法。

4、3D Shape Reconstruction from Sketches via Multi-view Convolutional Networks

作者来自:麻省大学阿默斯特校区

本文章提出了一种编码和解码的网络,结合优化方法,可以根据2D线图重建3D形状。首先将单个或者多个2D线图进行编码得到形状信息,然后解码得到多个视图下的深度和法线图,最后结合优化问题将多个视图进行融合得到3D点云,进而得到3D形状的拓扑网格。

(短报告之一)

除此之外,10日当天还有4场短报告、9个海报展示以及论坛“The challenges and opportunities in 3D sensing”。

(海报展示之一)

(论坛嘉宾,畅谈了3D感官的挑战和机遇)

本届大会由百度、光珀智能科技、纵目科技、商汤科技、阿丘科技、华为、银河水滴科技、图漾科技、先临三维科技、清影机器视觉技术、地平线、大势智慧科技、通甲优博等众多业界巨头和创业新星赞助。在海报展示的会场,各赞助商也同时向参会人员展示了他们在计算机视觉和图形学在三维领域的最新研究成果。

(参展商之一商汤科技在向陈宝权教授和高文院士介绍其手机端3D重建特效)

据雷锋网了解,此次会议虽然在中国本土举办,但是参会人员中有大约一半都是国外学者,而投稿及录取文章则有90%以上来自国外大学和研究单位。这一点,想想让人挺揪心的。

雷锋网注:本文照片皆为山东大学新闻组同学提供,特此感谢!

雷锋网