四足机器人的技术路线全景：从运动学、WBC、MPC到强化学习

四足机器人自从宇树机器狗出圈后得到频繁讨论，原因在于足式机器人几乎把机器人领域里核心的、先进的问题都搬到了一台机器上，要面对机构设计，电机驱动，运动学，动力学，状态估计，轨迹规划，全身控制，强化学习以及仿真到实机的迁移。所以这类足式机器人给作为初学者的我造成不小的困扰,问题不在于技术的细节，路线很多，但它们之间的关系不那么清晰，如何做到力位混合控制？如何将学习策略和模型控制结合？我们常常缺少一条完整的技术脉络。

当你开始做机器人，最关键的不是先选一个最先进的策略，而是看你的目标任务是要跑一条结构化的赛道？或者跑通用的locomotion?还是要面对复杂的环境？层出不穷的技术路线不应该简单堆叠在一起,而是要回答一个更实际的问题：如果要把一台四足机器人从能站、能迈步，逐步做到稳定奔跑、跳跃越障、复杂地形适应，甚至进一步做到学习型 locomotion，那么中间到底要跨过哪些层次，每一层又解决什么问题。

四足机器人的发展可以理解成一条不断抬高控制层级的路线。最底层解决的是几何问题，也就是腿在哪里、足端在哪里、关节该转多少；再往上一层，开始解决轨迹与时序问题，也就是摆动腿如何走、步态如何切换、机身姿态怎样补偿；继续往上，系统就不再满足于“把动作做出来”，而是要解决力和接触的问题，也就是支撑腿怎样提供地面反作用力、机身怎样维持平衡、接触切换如何保持稳定；再往后，控制器开始关心未来时域内的状态演化，于是出现 MPC；当问题空间进一步扩大到高维观测、复杂地形和非显式建模能力时，强化学习、模仿学习才开始真正进入主舞台。这个顺序不是绝对固定的，但如果缺少这种层次意识，很容易出现一种常见误区：把某一个方法当成答案，而忽略了它在整条系统链中的位置。

一、四足机器人真正的起点，是运动学而不是“高级控制”

只要是一台腿式机器人，首先就必须解决一个很朴素的问题：给定关节角，足端现在到底在什么位置；反过来，如果我希望足端去到某个位置，关节又该转到什么角度。前者是正运动学，后者是逆运动学。正运动学看起来只是一个“算位置”的工具，但它实际是状态可视化、足端误差计算、速度映射和调试分析的基础。如果没有正运动学，控制器甚至无法知道现在的腿究竟摆到了哪里。逆运动学更直接，它是从“我希望足端去哪里”到“电机应该怎么转”的桥梁。四足机器人的站立、下蹲、迈步、摆腿、落足，其实都离不开这一步。

一旦逆运动学打通，机器人就获得了最原始的一种能力：把空间中的足端目标点，转换成关节命令并由驱动器执行。很多工程体系都是在这个意义上真正开始工作的。可以把这理解为四足机器人最早的操作系统：它不一定聪明，但它至少让腿开始听话。哪怕只完成了逆运动学部分，你的机器人就能开始牙牙学步，而运动的效果更多依赖于人为给定的参数。

https://www.tup.com.cn/upload/books/yz/090429-01.pdf66
并联腿可以参考:
https://zhuanlan.zhihu.com/p/

二、从逆运动学到足端轨迹，四足机器人第一次进入“会走路”而不是“会摆腿”

仅仅有逆运动学，并不意味着机器人就会走。很多初学者在写出一套 IK 程序后，发现机器人确实能把腿摆到某个指定位置，但一旦连续运动起来，轨迹不顺、触地冲击大、步态节奏混乱、整机姿态飘动的问题就会集中暴露。原因很简单，逆运动学只解决了某一个瞬间的几何映射，却没有回答“这条腿应该沿着什么路径过去”以及“何时抬脚、何时落脚”的问题。

这就引出了足端轨迹规划。对于摆动腿来说，足端轨迹并不只是从 A6 点移动到 B 点那么简单。一个好的足端轨迹至少要同时满足几个要求：摆动过程中不能刮地，落足时不能带来过大的冲击，抬腿高度要足以越过障碍，摆动相的时间分配要与整体步态节奏匹配，而且轨迹本身还要尽量平滑，以免在逆运动学和关节控制层诱发高频抖动。因此，工程里常见的三次样条、五次多项式、贝塞尔曲线、摆线轨迹，本质上都在做同一件事：给摆动腿构造一条既能完成几何任务、又足够平滑可执行的路径。

在很多四足研究里，贝塞尔曲线之所以常被使用，一个重要原因就是它比较容易控制起点和终点附近的切向性质。对足端轨迹来说，这意味着触地前后的速度分布更容易设计，从而减小落足冲击。跳跃和高速步态研究里也经常看到三次多项式的使用，因为它能比较自然地约束位置、速度乃至加速度边界，让机体或腿部在起跳和落地阶段更连续。真正有经验的控制器，从来不会把足端轨迹看成一条纯几何曲线，它其实是步态、接触、姿态与执行器能力共同作用后的结果。

换句话说，逆运动学让机器人从“不会动”变成“能动腿”，而足端轨迹规划和步态时序设计，则让它第一次从“会摆腿”进入“会走路”的范畴。

三、为什么位置控制长期没有退出四足机器人的主舞台

只要谈到四足机器人，总会有人觉得位置控制“太基础”或者“不够先进”。这种看法的问题在于，它把方法和适用场景割裂开了。控制方式从来不能脱离问题本身去评价。对于大量样机、竞赛平台和第一阶段原型机来说，位置控制不但没有过时，反而往往是最合理的出发点。

原因并不复杂。位置控制最大的价值，在于它极其符合四足机器人早期开发的现实条件。首先，它实现简单，调试链条短，能迅速验证机械结构、逆运动学、轨迹规划和步态时序是否正确。其次，位置控制对于结构化环境非常有效。当场地是已知的，障碍高度和位置是可预估的，机器人的任务主要是完成固定动作时，位置控制完全可以支撑稳定、快速而且高度可复现的表现。再次，位置控制对硬件的要求相对友好。很多平台在关节力矩控制能力、状态估计质量和接触建模能力还不成熟时，直接上复杂动力学控制并不会更强，反而可能更不稳定。

这也是为什么在很多比赛型四足或并联四足项目中，位置控制长期占据主流。因为这些系统真正需要的，不是对任意未知地形都最优，而是在给定任务中把动作做到最好。比赛场景强调的是通过率、速度、稳定性和有限周期内的可交付性，只要逆运动学、足端轨迹和机身姿态补偿做得扎实，位置控制就完全可以支撑跳跃、跨障和快速通过。早期大量优秀平台恰恰都是沿着这条路线建立起来的。它们并不是因为“不懂复杂控制”才使用位控，而是在当时的任务和硬件条件下，这就是最经济也最有效的系统组织方式。

当然，位置控制也有明确边界。一旦任务从结构化场景走向复杂地形，接触不确定性和外部扰动显著增强，单纯靠几何轨迹跟踪就会出现根本性不足。问题不是它能不能把腿摆到指定位置，而是它没有直接回答“机器人此刻应该施加怎样的力才能维持平衡”的问题。也正是在这个意义上，四足控制才会从位置层逐步走向力层。

四、四足机器人一旦真正离开平地，问题就从“几何”变成了“力”

四足机器人在平地上按照预设轨迹迈步，看起来似乎已经完成了 locomotion 的主要任务。但只要环境稍微复杂一点，例如地面有坡度、有碎石、有高度突变，或者机器人需要提高速度、承受更大扰动，问题就会立刻发生变化。此时最关键的问题不再是“摆动腿怎么走”，而是“支撑腿在地面上究竟提供了怎样的力，机体为什么能稳定地被托住，又为什么会失稳”。

这就是四足机器人控制中一个非常重要的转折点：从运动学主导，走向动力学主导。只要机器人与地面的接触开始起决定性作用，控制器就必须关心支撑力、摩擦锥、质心加速度、机身姿态耦合以及接触切换时的冲击问题。传统的位置控制虽然仍然可以继续使用，尤其是在摆动腿一侧，但仅靠它已经不足以解释整机的稳定运动。

这一层最典型的思想，就是力位混合控制。它本身不是某个单一算法，而是一种非常自然的分工方式。摆动腿更适合做位置跟踪，因为它的任务是把足端送到预定落脚点；支撑腿更适合做力或阻抗控制，因为它的任务是通过地面反作用力来支撑机体、调节姿态并抵抗扰动。许多成熟的四足控制器本质上都遵循这个分工，只不过在实现层面上，有的用显式力控，有的用阻抗控制，有的通过优化求解接触力，有的则通过模板模型间接实现。

一旦进入力层，柔顺性也会变得特别重要。四足机器人与地面是不断碰撞和切换接触的系统，如果控制过硬，触地瞬间就会出现大冲击，关节抖振、足端反弹、甚至整机结构受损都会随之而来。很多跳跃控制工作之所以在落地阶段专门加入修正项，就是因为它们意识到，真正决定动作能否实用的，不只是起跳能不能跳得起来，更是落地能不能稳稳接住。现代高性能关节执行器之所以反复强调低减速比、可回驱和高带宽，也正是因为它们让控制器第一次有能力在真实机器上“认真处理力”。

五、模板模型的意义，不是简化问题，而是抓住最应该控制的量

当系统开始认真对待动力学问题时，另一个现实困难就会立刻出现：整台四足机器人太复杂了。完整动力学模型维度高、耦合强、接触切换频繁，如果一开始就对整机做全量建模和实时求解，工程上往往很难承受。因此，四足控制里才会反复出现各种模板模型。模板模型的价值从来不只是“把问题弄简单”，而是帮我们抓住在当前阶段最值得控制的核心量。

倒立摆模型的地位正是这样建立起来的。它把机器人抽象成质心与支撑点之间的关系，用低维方式描述平衡与速度演化，因此很适合做落脚点估计、速度调节和步态切换分析。再进一步，SLIP，也就是弹簧负载倒立摆，则把腿的弹性和身体的弹跳特性纳入进来，所以它特别适合解释跑动、跳跃和动态步态中的支撑相行为。许多四足跑跳控制之所以喜欢使用 SLIP，并不是因为它能完整描述一台机器人，而是因为它能很有效地抓住“身体像弹簧系统一样交换势能和动能”的本质。

再往上一步，就是单刚体模型。它把机器人躯干看成刚体，把腿与地面的作用浓缩为若干接触点和接触力，这样一来，质心加速度、角动量变化、支撑力分配和摩擦约束就都可以在统一框架下表达。现代四足控制里，大量 VMC、接触力 QP、MPC 和上层规划，本质上都是在单刚体模型或其变体上展开。之所以几乎所有高动态四足平台都要经过这一步，是因为它恰好处在“既足够简单、又足够有物理意义”的那个位置。

因此，模板模型并不是为了逃避真实机器人动力学，而是为了让控制器先学会抓住最关键的那几个量。你甚至可以说，四足技术路线中所谓“越来越高级”的过程，很大程度上就是模板模型越来越贴近真实系统、同时控制器处理约束和不确定性的能力越来越强的过程。

六、VMC 的价值，在于它第一次把“想让身体怎么动”直接翻译成了“应该施加什么力”

如果沿着上面的脉络继续往前走，VMC 会是一个非常自然的下一步。很多人第一次接触 VMC 时，往往会把它看成一种“比较直觉的力控”，这种理解并不算错，但还不够准确。VMC 真正的意义，在于它第一次把控制目标从几何轨迹层，明确地抬升到了虚拟力学层。

所谓虚拟模型控制，本质上就是在机器人身上想象一些虚拟的弹簧、阻尼器或其他力学元件，再根据这些虚拟元件产生机体所需的虚拟力和虚拟力矩，最后通过雅可比映射到关节扭矩。这种思想之所以强大，在于它提供了一种非常自然的中间语言。以往我们只能说“把身体抬高一点”“把姿态扶正一点”“让机身往前加速一点”，而 VMC 把这些语言统一翻译成“在身体上施加某个虚拟力或虚拟力矩”。一旦翻译完成，剩下的工作就是通过腿部几何关系把这些力落到关节上。

这使得 VMC 特别适合做机身高度控制、俯仰滚转姿态控制以及一些中低速动态步态中的支撑相控制。对很多四足原型机来说，VMC 往往是控制体系第一次从“纯几何”走向“动力学”的标志。它没有像优化控制那样一次性把所有约束都纳入进来，但已经能让系统围绕机体层面的目标进行闭环。

在 trot 控制中，VMC 之所以经典，也是因为它非常符合支撑相与摆动相的分工逻辑。摆动腿仍然可以沿着预定轨迹摆动，而支撑腿则通过虚拟力学元件托住机身、调节姿态和速度。再配合状态机和接触检测，系统就能形成一套相当完整的 locomotion 结构。这套结构的重要性并不在于它是不是“最优”，而在于它第一次让整机表现出一种比较真实的动态协同。

七、WBC 真正解决的，不是“控制更多东西”，而是“多个目标之间如何不互相打架”

只要四足机器人继续朝复杂任务推进，就迟早会碰到一个问题：你想控制的量越来越多了。你既想让机身保持姿态，又想让质心跟踪速度，还想让摆动腿按轨迹落脚，同时又不能违反摩擦约束、法向力约束和关节力矩限制。到了这个阶段，系统就不再是“加一个控制器控制一个量”那么简单，因为不同目标之间会彼此耦合、彼此竞争，甚至直接冲突。

WBC 的意义，正是在这里体现出来。它不只是“控制更多任务”，而是要回答多个任务如何在同一台机器人上同时成立。Whole-Body Control 本质上是一种整机层的任务协调框架。它允许你把姿态、速度、接触、摆动腿轨迹、力矩限制、关节约束等统一放到一个层级求解或优化求解框架里。换句话说，它真正要解决的是“谁优先、谁妥协、谁必须满足、谁可以近似满足”的问题。

很多现代 WBC 都采用 QP 形式来写。给定期望质心加速度、摆动腿轨迹误差和一系列接触约束，通过二次规划求出满足约束的足端力或关节加速度，再通过动力学关系映射到执行器命令。它的优势并不在于形式上看起来更“高级”，而在于它能把原本彼此冲突的任务，放进同一个可计算的框架中。对四足机器人来说，这一点极其关键。因为机器人不是一个单目标系统，而是一个多任务多约束系统。如果缺少 WBC 这样的框架，很多局部正确的控制律一叠加，就会互相打架。

也正因如此，VMC 与 WBC 最好的理解并不是替代关系，而是层次关系。VMC 可以负责构造机体层的目标，WBC 则负责在全身范围内协调这些目标与约束。很多高质量系统其实正是这样工作的：上层用直观的物理语言指定希望机器人怎么动，下层用更严格的数学框架来保证这些目标尽可能被实现。

八、MPC 的出现，标志着系统第一次开始认真考虑“未来几步之后会怎样”

如果说 WBC 解决的是当前时刻的多目标协调，那么 MPC 的核心贡献，就是把时间维度真正拉开了。它让四足控制器第一次不仅考虑“现在该怎么办”，还开始考虑“未来几步之后会怎样”。这件事之所以重要，是因为四足 locomotion 从来都不是一个静态问题。接触会切换，摆动腿会落地，质心会继续前移，身体会在几步之后才表现出当前决策的后果。只看当前误差，很多时候会让控制器显得“会反应，但不会预判”。

MPC 之所以在四足领域如此重要，正因为它特别适合处理这种随时间展开的问题。以 MIT Cheetah 3 路线为代表的凸 MPC 框架，本质上就是在一个有限预测时域内，基于简化刚体模型预测机身未来状态，并求解一组满足接触和摩擦约束的地面反作用力，然后将这些反作用力转化为关节扭矩。它看起来像是在求“当前该施加什么力”，但真正特别之处在于，这个力是通过未来一段时间的整体行为反推出来的。

这一步把四足 locomotion 推向了一个新的阶段。因为一旦控制器能在未来时域内规划支撑力，很多高速动态步态的问题就会一下子变得可控起来。加速、减速、转弯、抗扰动恢复、多步之间的平滑过渡，都可以在同一框架里被考虑。这也是为什么很多人第一次看到高水平四足平台时，会明显感觉它们的运动不再只是“腿在动”，而是整台机器的质心行为开始变得连贯、从容而且可预测。

当然，MPC 的代价也非常清楚。它需要相对准确的模型，需要较好的状态估计，需要更强的计算能力，还要面对接触不确定性和实时优化的压力。因此，MPC 从来不是一个“想用就用”的装饰件，它只有在平台整体能力达到某个程度后，才会真正释放价值。这也解释了为什么高性能科研平台和少数能力很强的竞赛平台会更早拥抱 MPC，而很多一般性系统不会把它作为起点。

九、locomotion 不是某个模块的名字，而是一整套移动能力的组织方式

四足机器人领域里有个词被频繁使用，但也最容易被误解，那就是 locomotion。很多人把它简单翻译成“走路算法”或者“运动控制模块”，其实这都太窄了。在四足语境里，locomotion 更接近一整套使机器人可靠移动的能力组织方式。

只要认真拆开看，就会发现 locomotion 几乎覆盖了从低层到高层的多种能力。它既包含步态时序和支撑摆动切换，也包含足端轨迹和落脚点设计；既依赖状态估计和机身速度控制，也依赖支撑力分配和接触处理；既可能包含 VMC、WBC、MPC 这类模型控制器，也可能包含 RL 这种学习型策略。换句话说，locomotion 不是某一个单独的算法模块，而是一整套围绕“让机器人持续而可靠地移动”建立起来的系统。

从这个角度再回头看前面那些名词，它们之间的关系就会清晰很多。步态决定节奏，足端轨迹决定几何路径，模板模型决定你关注哪些物理量，VMC/WBC/MPC 决定你如何构造和分配控制目标，而 RL 则提供了另一种策略生成方式。它们不是平铺在纸面上的并列概念，而是在同一个 locomotion 问题中处于不同层次、扮演不同角色的部件。

十、步态和足端轨迹之所以重要，不是因为它们“基础”，而是因为它们定义了整机运动的骨架

在很多高层控制讨论中，步态和足端轨迹容易被低估，好像一旦进入 WBC、MPC 或 RL，这些东西就退到幕后了。其实恰恰相反。无论控制器多高级，整机运动最终都必须落回支撑相、摆动相和足端落脚这几件事上。也就是说，步态和足端轨迹不是过时的基础件，而是所有高层控制必须依附的骨架。

所谓步态，本质上规定的是哪条腿在什么时刻支撑、哪条腿在什么时刻摆动、相位差是多少、占空比怎样分配，以及这些时序对稳定性、速度、能耗和灵活性产生什么影响。Walk、trot、pace、bound、gallop 之所以看起来像不同“风格”，其实背后都是不同的支撑序列和时序逻辑。对四足机器人来说，步态从来不是给动作起一个名字那么简单，而是在规定整机能量交换和接触模式的基础节奏。

足端轨迹则是这个节奏在空间中的具体化。摆动腿走多高、多快、何时开始抬脚、何时准备落脚、落脚点如何随机身速度调节，这些都会直接决定机器人运动的平顺性和鲁棒性。哪怕在高水平控制系统中，摆动腿通常仍然依赖精心设计的轨迹或轨迹生成器，因为这部分问题非常适合通过几何方式解决。真正成熟的 locomotion 系统，往往不是用一种方法包办一切，而是让步态、足端轨迹、机身控制和接触力控制各司其职。

十一、强化学习并没有推翻四足机器人学，而是把“怎么得到策略”这件事换了一种表达方式

过去几年里，四足机器人最吸引眼球的变化，当然是强化学习的大规模进入。很多人因此产生一种印象：仿佛模型控制正在退场，强化学习将成为通用答案。这个判断其实过于简单。强化学习真正改变的，并不是四足机器人需要解决的问题，而是控制器获得策略的方式。

无论是模型控制还是强化学习，最终都在试图得到某种意义上的最优策略。区别在于，模型控制通常要求研究者显式构造系统模型、任务目标和约束，然后通过推导或优化求解得到控制律；强化学习则是在定义观测、动作和奖励之后，通过大量交互数据去搜索一个高回报策略。它并没有取消状态估计、接触问题、执行器限制和仿真精度这些前提，只是把一部分显式求解工作，交给了策略搜索过程。

四足机器人上强化学习之所以会爆发，并不是因为它突然神奇地解决了所有问题，而是因为一系列前提同时成熟了。快速仿真器让大规模并行采样成为可能，高性能而相对可负担的执行器让学习到的策略更有机会真实执行，PPO、SAC 等连续控制算法在大规模训练中变得更稳定，域随机化和 sim-to-real 技术则让策略不那么容易困死在仿真器里。也就是说，RL 的成功从来不是一个算法单独造成的，而是硬件、仿真、算法和系统工程共同成熟的结果。

这也是为什么在四足 locomotion 中，PPO 会成为最常见的训练方法之一。它与大规模并行仿真适配性好，训练流程相对稳定，工程实现成熟，因此非常适合做基础 locomotion policy。而 SAC 之类 off-policy 方法则在样本效率方面更有吸引力，但链路复杂度也更高。AMP 这类方法更进一步，它关注的不仅是“完成任务”，而是“动作是否像某种自然示范”。这些方法并不是在互相替代，而是在不同层面扩展策略获得的方式。

十二、sim-to-real 说明了一件最朴素也最重要的事：控制从来不是只在软件里成立

任何一个做过四足强化学习的人，最终都会撞到 sim-to-real 这堵墙。仿真里很稳定的策略，上到实机就摔；仿真里动作很漂亮，实机却抖得一塌糊涂。表面看，这像是学习方法的问题；但从更深层讲，这恰恰说明四足机器人控制从来不是一个单纯的软件问题。

仿真与现实之间的差异来源非常多。执行器会发热，通讯会有延迟，材料接触并不理想，脚垫并非刚体，摩擦系数随地面变化，电机模型并不精确，传感器噪声也比仿真中更复杂。更棘手的是，策略可能学会利用仿真器的某些漏洞，而这些漏洞在现实中根本不存在。于是，一套在仿真里看似优雅的策略，到了现实中就会立刻暴露脆弱性。

所以 sim-to-real 的真正意义，在于迫使研究者重新承认机器人系统的整体性。域随机化当然重要，因为它让策略不那么依赖单一模型参数；动作和奖励设计也重要，因为不合理的奖励会鼓励策略学出高频震荡甚至 bang-bang 式动作；但更深层的前提，是整个平台必须在硬件和控制层面具备承接这些策略的能力。执行器要足够可控、结构要足够抗冲击、传感器和通讯要稳定、系统安全边界要清晰。没有这些，所谓“学习控制”往往只会停留在视频演示的阶段。

因此，sim-to-real 不是强化学习的附属议题，而是整条四足技术路线在进入学习时代后必须共同面对的总考题。它提醒我们，仿真中学到的能力必须在真实物理世界中重新被证明，而这种证明从来都不是算法单独完成的。

十三、所谓技术路线，最终不是概念排序，而是系统能力的分阶段展开

如果把前面所有内容压缩成一句话，我会说，四足机器人的技术路线并不是运动学、VMC、WBC、MPC、RL 这些词的简单排列，而是一条系统能力逐层展开的路线。最开始，机器人先学会几何映射，也就是运动学与逆运动学；接着，它学会沿着平滑轨迹执行动作，也就是足端轨迹和位置控制；再往后，它开始认真对待支撑力与接触，也就是力位混合控制、柔顺性和模板模型；之后，系统进入机体层的动力学控制，于是出现 VMC；当目标与约束越来越多，控制器必须在全身范围内协调任务，于是出现 WBC；再往上一步，控制开始关注未来时域中的行为演化，于是出现 MPC；最后，当环境复杂度、观测维度和任务开放性进一步扩大，强化学习、模仿学习和 sim-to-real 才真正接管一部分策略生成工作。

用这样的视角再去看四足机器人，就不会再执着于问“哪种方法最先进”。真正更有价值的问题是：在当前硬件条件、任务场景和工程阶段下，哪一层控制抽象最合适，哪一种方法最能解决眼前的问题，哪些前提还没有具备，哪些步骤不能跳过。很多时候，技术路线的难点并不在于不知道有什么方法，而在于能否判断系统此刻究竟应该停留在哪一层，又该向哪一层推进。

十四、总结

四足机器人之所以迷人，正在于它不是单一学科的产物。你无法只靠运动学把它做成，也无法只靠强化学习让它稳定工作；你不能忽视轨迹规划，也不能假装动力学和接触约束不存在；你既要接受很多系统最开始只能从位置控制起步，也必须承认高水平 locomotion 最终会走向更完整的动力学控制和学习控制。真正成熟的四足技术路线，从来不是排斥某一种方法，而是知道每一种方法在整条链路中的位置。

所以，与其执着于“PPO 和 MPC 哪个更厉害”“WBC 会不会替代 VMC”，不如把视角放回系统本身。四足机器人不是从某个最强算法开始的，而是从运动学和轨迹起步，逐步进入力控、模板模型、整机协同、预测控制，再延伸到学习控制与 sim-to-real 的系统工程。只有在这个意义上去理解所谓技术路线，这些看似分散的概念才会真正连成一张图。