PaddlePaddle · luotao1 · Jul 9, 2025 · Jul 7, 2025
diff --git a/paddle/phi/kernels/fusion/fp8_gemm/fp8_gemm_with_cublasLt/cublaslt_gemm.h b/paddle/phi/kernels/fusion/fp8_gemm/fp8_gemm_with_cublasLt/cublaslt_gemm.h
@@ -293,7 +293,7 @@ void CublasLtMatmulFP8(const phi::GPUContext& dev_ctx,
 
 template <typename Context>
 void cublaslt_fp8_fp8_fp16_gemm(
- const Context& ctx,
+ const Context& dev_ctx,
  const DenseTensor& x,
  const DenseTensor& y,
  const paddle::optional<DenseTensor>& bias,
@@ -339,18 +339,18 @@ void cublaslt_fp8_fp8_fp16_gemm(
  common::errors::InvalidArgument(
  "FP8 gemm need k % 16 = 0, but k = %d", k));
 
- ctx.template Alloc<phi::dtype::float16>(out);
+ dev_ctx.template Alloc<phi::dtype::float16>(out);
  int batch_count = 1;
  for (size_t i = 0; i < rank - 2; ++i) {
  batch_count *= x.dims()[i];
  }
  CublasLtMatmulFP8<phi::dtype::float16>(
- ctx, batch_count, m, n, k, x, y, scale, bias, activation_type, out);
+ dev_ctx, batch_count, m, n, k, x, y, scale, bias, activation_type, out);
 }
 
 template <typename Context>
 void cublaslt_fp8_fp8_bf16_gemm(
- const Context& ctx,
+ const Context& dev_ctx,
  const DenseTensor& x,
  const DenseTensor& y,
  const paddle::optional<DenseTensor>& bias,
@@ -396,13 +396,13 @@ void cublaslt_fp8_fp8_bf16_gemm(
  common::errors::InvalidArgument(
  "FP8 gemm need k % 16 = 0, but k = %d", k));
 
- ctx.template Alloc<phi::dtype::bfloat16>(out);
+ dev_ctx.template Alloc<phi::dtype::bfloat16>(out);
  int batch_count = 1;
  for (size_t i = 0; i < rank - 2; ++i) {
  batch_count *= x.dims()[i];
  }
  CublasLtMatmulFP8<phi::dtype::bfloat16>(
- ctx, batch_count, m, n, k, x, y, scale, bias, activation_type, out);
+ dev_ctx, batch_count, m, n, k, x, y, scale, bias, activation_type, out);
 }
 
 } // namespace cutlass_internal