策略节点

概述

IB-Robot 推理系统提供两个策略节点，它们协同支持 monolithic（单进程）和 distributed（device-edge-cloud）两种执行模式：

节点	包	可执行文件	目的
lerobot_policy_node	`inference_service`	`lerobot_policy_node`	主策略节点。向 `action_dispatcher_node` 暴露 `DispatchInfer` Action Server。处理观测订阅、契约驱动过滤，并协调推理 src/inference_service/inference_service/lerobot_policy_node.py:148-158。
pure_inference_node	`inference_service`	`pure_inference_node`	分布式模式中的 GPU 推理 worker。订阅预处理 batch，运行推理，并发布原始动作。不暴露 Action Server src/inference_service/inference_service/lerobot_policy_node.py:22-26。

执行模式架构

        graph TB
    subgraph "Monolithic_Mode"
        direction TB
        LRPN_MONO["LeRobotPolicyNode"]
        COORD["InferenceCoordinator<br/>(Pre_→_Infer_→_Post)"]
        
        LRPN_MONO -->|"owns"| COORD
    end
    
    subgraph "Distributed_Mode"
        direction TB
        LRPN_DIST["LeRobotPolicyNode<br/>(Edge_Proxy)"]
        PIN["PureInferenceNode<br/>(Cloud_GPU)"]
        
        LRPN_DIST -->|"/preprocessed/batch"| PIN
        PIN -->|"/inference/action"| LRPN_DIST
    end
    
    DISPATCHER["ActionDispatcherNode"]
    
    DISPATCHER -->|"DispatchInfer<br/>Action_Client"| LRPN_MONO
    DISPATCHER -->|"DispatchInfer<br/>Action_Client"| LRPN_DIST

关键设计原则： 两种执行模式都向 action_dispatcher_node 暴露相同的 DispatchInfer Action Server 接口。分布式模式对客户端完全透明，客户端无法区分 monolithic 和 distributed 执行 src/inference_service/inference_service/lerobot_policy_node.py:155-158。

来源： src/inference_service/inference_service/lerobot_policy_node.py:3-34，src/robot_config/robot_config/launch_builders/execution.py:9-12

lerobot_policy_node

LeRobotPolicyNode src/inference_service/inference_service/lerobot_policy_node.py:148 是与动作分发流水线集成的主推理节点。它加载策略 checkpoint，订阅机器人契约中定义的观测，并生成动作预测。

节点逻辑流程

        graph TB
    subgraph "LeRobotPolicyNode_Implementation"
        direction TB
        
        INIT["LeRobotPolicyNode.__init__"]
        
        subgraph "Configuration_Phase"
            LOAD_POLICY["_load_policy_config<br/>Read_config.json"]
            LOAD_CONTRACT["_load_contract<br/>robot_config_→_Contract"]
            FILTER["Filter_observations<br/>by_input_features"]
        end
        
        subgraph "Observation_Pipeline"
            SETUP_SUBS["_setup_observation_subscriptions"]
            OBS_CB["_obs_cb<br/>Push_to_StreamBuffer"]
            SAMPLE["_sample_obs_frame<br/>Sample_all_buffers"]
        end
        
        subgraph "Execution_Logic"
            SETUP_MONO["_setup_monolithic_mode"]
            SETUP_DIST["_setup_distributed_mode"]
        end
        
        subgraph "Action_Handling"
            ACTION_SERVER["DispatchInfer_Action_Server"]
            EXEC_CB["_dispatch_infer_callback"]
            EXEC_MONO["_execute_monolithic"]
            EXEC_DIST["_execute_distributed"]
        end
        
        INIT --> LOAD_POLICY
        LOAD_POLICY --> LOAD_CONTRACT
        LOAD_CONTRACT --> FILTER
        FILTER --> SETUP_SUBS
        
        INIT --> SETUP_MONO
        INIT --> SETUP_DIST
        
        INIT --> ACTION_SERVER
        ACTION_SERVER --> EXEC_CB
        EXEC_CB --> SAMPLE
        SAMPLE --> EXEC_MONO
        SAMPLE --> EXEC_DIST
    end

初始化与过滤

节点从两个来源加载配置：

Policy Config（config.json）：定义模型架构和所需 input_features src/inference_service/inference_service/lerobot_policy_node.py:204-205。
Robot Config（YAML）：通过 Contract 定义所有可用观测 src/inference_service/inference_service/lerobot_policy_node.py:133-134。

观测过滤： 节点会根据模型所需输入过滤观测。这让单个 robot_config.yaml 可以支持观测需求不同的多个模型 src/inference_service/inference_service/lerobot_policy_node.py:161-168。

观测订阅

节点为所有过滤后的观测创建 ROS subscription，每个 subscription 都带有 StreamBuffer，实现契约中的重采样策略 src/inference_service/inference_service/lerobot_policy_node.py:117-120。

状态拼接： 节点会处理来自不同 topic 的多个 observation.state spec，在采样期间拼接数值，形成模型使用的单个 tensor src/inference_service/inference_service/lerobot_policy_node.py:197-198。

来源： src/inference_service/inference_service/lerobot_policy_node.py:148-209

执行模式

Monolithic 模式

在 monolithic 模式中，节点拥有 InferenceCoordinator src/inference_service/inference_service/lerobot_policy_node.py:9-11。它在单个进程中执行全部三个阶段（预处理、推理、后处理），支持 zero-copy tensor 传递 src/inference_service/inference_service/lerobot_policy_node.py:154-154。

Distributed 模式

在 distributed 模式中，节点作为异步代理。它使用 TensorPreprocessor 执行本地预处理，将 batch 通过 cloud_inference_topic 发布到 cloud 节点，并阻塞 action callback，直到在 cloud_result_topic 上收到匹配 request_id 的响应 src/inference_service/inference_service/lerobot_policy_node.py:13-20。

来源： src/inference_service/inference_service/lerobot_policy_node.py:3-34，src/robot_config/robot_config/launch_builders/execution.py:155-165

pure_inference_node

pure_inference_node 是轻量 GPU worker。它订阅预处理 batch，通过模型引擎运行推理，并发布原始动作 tensor。

节点架构

        graph TB
    subgraph "PureInferenceNode_GPU_Worker"
        direction TB
        
        SUB["Subscription<br/>/preprocessed/batch"]
        PUB["Publisher<br/>/inference/action"]
        
        subgraph "Callback:_PureInferenceNode._inference_cb"
            DECODE["TensorMsgConverter.from_variant"]
            EXTRACT_ID["Extract_task.request_id"]
            INFER["PureInferenceEngine.__call__"]
            ENCODE["TensorMsgConverter.to_variant"]
        end
        
        SUB --> DECODE
        DECODE --> EXTRACT_ID
        EXTRACT_ID --> INFER
        INFER --> ENCODE
        ENCODE --> PUB
    end

推理逻辑

节点是无状态的，并会从输入到输出保留 request_id，以便 edge 节点匹配响应 src/inference_service/inference_service/lerobot_policy_node.py:18-20。

来源： src/inference_service/inference_service/lerobot_policy_node.py:22-26，src/inference_service/setup.py:34-34

与 Action Dispatcher 通信

ActionDispatcherNode src/action_dispatch/action_dispatch/action_dispatcher_node.py:43 通过 DispatchInfer action client 与这些节点交互 src/action_dispatch/action_dispatch/action_dispatcher_node.py:159-161。它根据动作队列的 watermark 阈值触发推理 src/action_dispatch/action_dispatch/action_dispatcher_node.py:80-80。

特性	Monolithic Mode	Distributed Mode
Edge Node	`lerobot_policy_node`	`lerobot_policy_node`
Cloud Node	N/A	`pure_inference_node`
接口	`DispatchInfer` Action Server	`DispatchInfer` Action Server
数据流	Zero-copy local tensors	通过 ROS2 topics 传输 `VariantsList` src/inference_service/inference_service/lerobot_policy_node.py:17-25

来源： src/action_dispatch/action_dispatch/action_dispatcher_node.py:159-161，src/inference_service/inference_service/lerobot_policy_node.py:27-33，src/robot_config/robot_config/launch_builders/execution.py:155-165