首页 >> 中医药酒

CVPR 2022 | 应用于旋转复归的流形投影梯度层

发布时间:2025年08月03日 12:18

贴图一维中的的其他部门六边方形 (也是一个拉普拉斯曲面)上的一个其他部门方向标量来参阅我们的工具。如果我们要用人工神经网络平台去重生 上的一个类型 (满足 ),那么最常用的动握法是首先用人工神经网络平台去得借助于一个 中的的类型 ,然后先通过一个曲面可定义 来得不到 。这就是人工神经网络平台正向传播的流程。在特训的时候,人们会对 施另加一个伤亡算子 (常见的自由选择是 ),然后用基于链式法则来近似值 二阶并进一步反向传播给网络平台,用于越来越新网络平台的变量。

我们推测这样的反向传播流程并不是一个系统的。我们比如说,由于 属于一个给定在贴图一维中的的二维曲面(其他部门六边方形),我们渴望网络平台能用二阶越来越新权重后能够使得 越来越另加北边同在曲面上的 ,可以理解为可以得不到一个一般来说的二阶(拉普拉斯二阶)使得 可以在曲面上越来越新。然而,必要根据 近似值二阶(解析几何二阶)然后另加到 上,平常会引发 离开六边方形上。从这个意和义上讲,这样的二阶含有杂讯,在此之后反传这一二阶给网络平台权重会使得越来越新后的网络平台未必能重生借助于一个不太好的 使得其经过曲面可定义 后得不到的 越来越近似于 。

因此,我们首先用于曲面上的最佳化技术开发——拉普拉斯最佳化(Riemannian optimization)来得不到一个在拉普拉斯曲面 上的越来越新 ,先次进一步能用它来近似值 的二阶:我们渴望降到的借以是让 沿二阶方向动握一次越来越新后能满足 。最必要的彻底解决办法是令 ,但是由于可定义 平常是多对一的可定义, 得不到的往往是一个可将近而非单一类型(对二维六边方形来说,这个类型可将近就是一条从抛物线表明通过 的射线),因此我们无需从这个可将近中的选一个一个系统的 来近似值 。

我们进一步意识到,这个四处寻找一个系统的流程其实可以叠加于多正确究竟(multi-ground truth)的监督弊端。He et al. [4] 在监督网络平台四元将近的转换器时曾遇到过这样一个弊端:由于四元将近 和 都都有了同一个摆动乘法,差不多存在两个正确究竟,但是网络平台的转换器并不是一个常见于而是一个特定标量,它只能往 或者 其中的一个北边,因此在近似值伤亡算子时必须从 和 这两个究竟中的选收其一。考虑到渴望网络平台能以尽可能小的变动去借助于所无需的越来越新,他们提借助于的彻底解决办法是选收离现阶段网络平台转换器值近来的那个究竟。受他们的很感兴趣,我们也用于了同样的办法去选收一个系统的 : 。针对摆动乘法的并不相同声称,我们都进行时了假设,求借助于了这一步的解析解,因此不无需用于最佳化的办法去找 ,不想引进额外的时间所需。就此,我们可以得不到 的 PMG(projective manifold gradient,布2左边紫色对角) 。

在物理中的,我们推测由于 ,以上述方式近似值借助于来的二阶 PMG 会持续地给 的模长 一个变大的21世纪(如布2中的),在并不相同曲面、并不相同声称上除此以外有此情况。这会使得网络平台的转换器变得特别的小,差不多等效地增另加了比较学习所部(learning rate),遭受特训的不稳定和网络平台收敛的困难。为了彻底解决这一弊端,我们无需引进一项额外的正则项来稳定转换器的模长,先次得不到 的 RPMG(regularized projective manifold gradient,布2左边紫色对角) 。如布2直所示,我们在物理中的推测只无需收一个越来越另加小的 就可以避免模长消失的弊端。

布2. 工具直观示意布(左边); 不另加正则项时网络平台必要转换器 x 的模长关于特训流程的转变21世纪布(中的); 另加正则项时网络平台必要转换器 x 的模长关于特训流程的转变21世纪布(直)。

2 物理结果

虽然上面我们只参阅了 的情方形,但我们的工具可以推动到摆动乘法的各种声称(representation),如 四元将近(quaternion)、 6D[1]、 9D[2]、 10D[3]。通过大量物理,我们可验证了在摆动乘法的各种声称、各类使命中的,用于我们提借助于的二阶反传层得不到的工具 RPMG-Quat、 RPMG-6D、 RPMG-9D、 RPMG-10D,相较于各自的 baseline 都能有尤为很大的性能大幅提高。

我们的主物理是基于贴图点云的都可级星纤位姿估计值。我们用一个星纤的贴图点云作为输入,渴望网络平台去得借助于输入的点云 比较于该类星纤原订和义的星纤坐标系的摆动 。我们用于和 ground truth 摆动乘法的 L2 loss 来作为伤亡算子。物理结果如布3、布4所示,可以看借助于我们的二阶层能在并不相同都可的星纤、并不相同的摆动乘法声称下(布3),在各个将近值区间都能获得很大的大幅提高(布4直)。另外我们的工具能收敛得越来越快越来越好(布4左边)。

布3. 基于 ModelNet [5] 贴图点云的都可级星纤位姿估计值。Mn,Md,Acc 分别都有平除此以外角度看将近值(Mean)、角度看将近值中的位将近(Median)、角度看将近值小于5%uB0的倍将近(5났curacy)。

下左边布是对于飞机这个类的特训流程中的平除此以外角度看将近值的转变可能会,可以看借助于我们的工具能收敛的越来越快越来越好。下直布是角度看将近值的常见于可能会,可以看借助于我们的工具在各个将近值区间都能很大优于 baseline。

布4. 特训流程中的特训集上平除此以外角度看将近值的转变可能会(左边),特训完成后在检验集上角度看将近值的常见于可能会(直)。星纤都可除此以外为飞机。

此外,我们的工具在基于布片的都可级星纤位姿估计值的物理中的(布5),也能有很大、相反的大幅提高。物理的所设和第一个物理完全相反,唯一的区别是给网络平台的输入变成了一张包含特定都可星纤的二维布片。

布5. 基于 ModelNet [5] 二维布片的都可级星纤位姿估计值。Mn,Md,Acc 分别都有平除此以外角度看将近值(Mean)、角度看将近值中的位将近(Median)、角度看将近值小于5%uB0的倍将近(5났curacy)。

我们还能用对于捕虫这一类的贴图点云位姿估计值物理,在其他曲面上可验证了我们提借助于的算法(布6)。由于捕虫不具对称性,它的位姿被UA方向唯一确定,因此我们只无需得借助于一个贴图一维中的模长为1的其他部门标量无需(也是我们在参阅工具时所举的恰当的事例)。网络平台的输入几乎是清晰的、随机摆动后的星纤点云,转换器是该捕虫点云的UA方向。我们的 RPMG 几乎可以很大大幅提高该使命的表现。

布6. 其他曲面上类型的重生物理。

越来越多其他物理,如自监督的贴图点云位姿估计值、单反相机重定位的物理,商量简述原科学研究成果。

参考文献:

[1] Zhou, Yi, et al. CoquotOn the continuity of rotation representations in neural networks." CVPR 2019.

[2] Levinson, Jake, et al. CoquotAn analysis of svd for deep rotation estimation." NeurIPS 2020.

[3] Peretroukhin, Valentin, et al. CoquotA smooth representation of belief over so (3) for deep rotation learning with uncertainty." Robotics: Science and Systems 2020.

[4] Wang, He, et al. CoquotNormalized object coordinate space for category-level 6d object pose and size estimation." CVPR 2019.

[5] Wu, Zhirong, et al. Coquot3d shapenets: A deep representation for volumetric shapes." CVPR 2015.

具身认知与交互物理室

具身认知与交互物理室 EPIC Lab (Embodied Perception and InteraCtion Lab)由王鹤Clark于2021年创立。该物理室专注于科学研究贴图电脑光影和EVA学,科学研究目标是建立和学习面向通用智能纤的、可泛化的EVA光影系统和星纤操控策略。。

厦门白癜风医院哪家比较专业
广州男科医院哪里好
海口看白癜风去哪里好
上海妇科检查哪家医院好
武汉比较好的妇科医院

上一篇: 川发龙蟒最新公告:预计2022年全年上年不低于76亿元

下一篇: 理想L9最新消息!可直连Switch/发布会中止

友情链接