vllm-project · simon-mo · Jul 12, 2025 · Jul 11, 2025 · gemini-code-assist · Jul 11, 2025
@@ -5,7 +5,6 @@
 
 import torch
 
-from vllm.model_executor.layers.fused_moe import fused_experts
 from vllm.model_executor.layers.fused_moe.layer import (FusedMoE,
  FusedMoEMethodBase)
 from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
@@ -467,6 +466,7 @@ def apply(
  logical_to_physical_map: Optional[torch.Tensor] = None,
  logical_replica_count: Optional[torch.Tensor] = None,
  ) -> torch.Tensor:
+ from vllm.model_executor.layers.fused_moe import fused_experts
 
  if enable_eplb:
  raise NotImplementedError(