SO(3)是什么全称Special Orthogonal Group in 3 Dimensions三维特殊正交群1️⃣Orthogonal正交矩阵是正交矩阵orthogonal matrix列向量互相垂直、长度为1 本质不会改变长度和角度长度和角度不变这个约束是对“整个刚体”成立人体不是一个整体刚体而是“多个刚体骨头通过关节连接”。一个点在胳膊前臂一个点在肩膀上臂/躯干这两个点之间的距离/角度可能会变但它们不属于同一个刚体。上臂上的两个点 满足距离不变 、角度不变 因为整块骨头是刚体 → 用一个 SO(3) 旋转描述同一根骨头是同一个刚体一个刚体变换 旋转SO(3)) 平移整个身体多个刚体关节约束层级结构2️⃣Special特殊行列式等于1det(R)1 含义不包含“镜像翻转”、只包含“纯旋转”如矩阵x 不变y → -y相当于关于 x 轴的镜像行列式 det⁡(A)−13️⃣Group群这些矩阵组成一个“群”满足可以相乘组合旋转如从 root 累乘到手、有单位元不旋转如关节处于T-pose无旋转、有逆反向旋转如抵消某个关节旋转这个“3”不是表示3维向量而是“3维空间中的旋转”SO(3) 所有在三维空间中的旋转变换在3D空间中绕 x 轴旋转、绕 y 轴旋转、绕 z 轴旋转所有这些旋转组成的集合 SO(3)SO(3)的数学形式SO(3) 是SO(3){R∈R3×3∣RTRI, det(R)1}所有满足正交、行列式为1的 3×3矩阵关键点论文核心SO(3) 虽然描述3D旋转但它本身不是普通的三维空间是一个有复杂拓扑结构的非线性空间类似“弯曲的空间”所以用简单的3D/4D向量表示出现不连续问题直观理解SO(3)每一个旋转 一个点 所有可能的旋转 一个“空间”这个空间就是SO(3)SO(3)是“所有三维旋转”的集合用3×3正交矩阵表示“3”表示旋转发生在三维空间中什么是流形流形manifold局部看起来像普通空间但整体可能是弯的空间定义一个空间如果在每个小邻域都“长得像” ℝⁿn维欧氏空间那它就是一个n维流形直观例子地球表面球面 S² 整体是球弯的 局部你脚下看起来像二维平面地球表面 二维流形局部像 ℝ²平面、但整体不是平面如1️⃣圆整体一个圈、局部像一条线 是 1维流形2️⃣ 圆柱局部像平面、整体卷起来了 是 2维流形为什么说 SO(3)是“3维流形”因为任意一个旋转附近可以用3个参数平滑描述任意方法只要能表示即可如轴2维、角度1维所以局部 ≈ ℝ³ ❗但整体不是ℝ³因为有“绕一圈回到原点”的结构、有拓扑粘合q ≡ -q、空间是“弯”的所以SO(3) 是3维流形每个小范围内像普通3维空间但整体结构是弯曲且有特殊拓扑的空间但不是普通3维空间因此不能用简单的3D或4D向量连续表示。一个形象的类比是你无法把橙子皮球面完整无皱地铺平在桌子上但如果允许多一个维度就可以。流形vs普通空间特性普通空间ℝⁿ流形全局平的可以弯局部平的也平的拓扑简单复杂流形“局部像直线/平面”但整体可能完全不同九、终极直觉神经网络在“平地”ℝⁿ普通欧几里得空间上学习SO(3)一个“弯曲空间”非要把“弯曲空间”摊平 一定会撕裂不连续论文的核心问题就是能不能把SO(3)这个流形连续地铺展到欧氏空间Rⁿ里答案是铺到 R⁴ 或更低维 →不可能拓扑上无法嵌入铺到 R⁵ 或 R⁶ →可以这就是5D和6D表示的来源论文做的事情就是找一个更高维空间让这个“弯曲空间”能平滑放进去6D表示流形就是“局部像欧几里得空间、整体可能弯曲”的空间而SO(3)正是这样的一个3维流形。RP 实射影空间Real Projective SpaceSO(3) ≅ RP³这是论文的关键拓扑事实三维旋转可以用旋转轴 旋转角度来描述旋转轴是一个方向单位向量旋转角度范围是 [0°, 180°]关键在于绕轴 n 转180° 绕轴 -n 转180°这正好就是对径点等同的结构和 RP³ 完全一致所以 SO(3) 和 RP³ 在拓扑上是同一个东西。RP¹(x,y)∼λ(x,y)λ不等于0只要是同一条直线从原点出发就算同一个点所以 (2,2)2⋅(1,1) 它们在同一条直线上 → 相同哪个圆都一样因为只关注方向圆只是“标准化后的表示”我们通常会做一步操作 把所有向量“压到单位圆上”RP¹ 不是圆上的点是“所有方向”圆只是把这些方向可视化的一种方式只是说圆上对径点的方向相同与长度无关符号含义直观理解RP²二维实射影空间球面对径点粘合无法在R³中无自交展示RP³三维实射影空间四维空间中三维球面对径点粘合等价于SO(3)三维球面 S³ 是什么S³ 是满足以下方程的所有点的集合它存在于四维空间R⁴ 中类无法直接想象它的样子。但可以用类比来感受低维类比S¹圆圈 二维平面里到原点距离为1的所有点S²球面 三维空间里到原点距离为1的所有点S³ 四维空间里到原点距离为1的所有点规律完全一样只是高了一维论文用 SO(3) ≅ RP³ 这个事实加上拓扑学中已知的RP³ 最少需要嵌入 R⁵的结论直接推出了三维旋转的表示至少需要5维。旋转矩阵用来表示“空间旋转”的矩阵二维例子旋转 θ 的矩阵第一列向量表示单位向量 (1,0) 旋转之后的位置θ 0 → (1,0)θ 90° → (0,1)θ 180° → (-1,0) 举例旋转90°旋转矩阵的两个核心性质1️⃣ 保持长度 不拉伸、不压缩2️⃣ 保持角度 不改变夹角旋转矩阵 刚体变换rigid motionstereographic projection球极平面投影把“球面上的点”映射到“平面”上球面不是欧几里得空间有“弯曲”所以用 stereographic projection球面 → 平面相当于Sⁿ → ℝⁿ