Update gemma3.py

socrahow · web-flow · commit 1bb7e3ffab40 · 2025-08-20T14:01:16.000+08:00
change code format
diff --git a/vllm_ascend/models/gemma3.py b/vllm_ascend/models/gemma3.py
@@ -4,27 +4,25 @@
 import torch
 from torch import nn
 from transformers import Gemma3TextConfig
-
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
+from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import \
     VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import (
     default_weight_loader, maybe_remap_kv_scale_name)
-from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.models.gemma3 import (Gemma3DecoderLayer,
                                                Gemma3Model,
                                                Gemma3Attention,
                                                Gemma3MLP,
                                                Gemma3ForCausalLM)
-from vllm_ascend.quantization.w8a8 import AscendW8A8LinearMethod
-from vllm_ascend.ops.layernorm import AddRMSNormW8A8Quant, AscendRMSNorm
-
 from vllm.model_executor.models.interfaces import SupportsLoRA, SupportsPP
 from vllm.model_executor.models.utils import (is_pp_missing_parameter,
                     make_empty_intermediate_tensors_factory, make_layers,
                     maybe_prefix)
+from vllm_ascend.ops.layernorm import AddRMSNormW8A8Quant, AscendRMSNorm
+from vllm_ascend.quantization.w8a8 import AscendW8A8LinearMethod
 
 class AscendGemma3DecoderLayer(Gemma3DecoderLayer):
     def __init__(
@@ -57,12 +55,12 @@ def __init__(
             prefix=f"{prefix}.mlp",
         )
         
-        self.input_layernorm = AscendRMSNorm(
-            config.hidden_size, eps=config.rms_norm_eps)
-        self.post_attention_layernorm = AscendRMSNorm(
-            config.hidden_size, eps=config.rms_norm_eps)
-        self.pre_feedforward_layernorm = AscendRMSNorm(
-            config.hidden_size, eps=config.rms_norm_eps)
+        self.input_layernorm = AscendRMSNorm(config.hidden_size,
+                                             eps=config.rms_norm_eps)
+        self.post_attention_layernorm = AscendRMSNorm(config.hidden_size,
+                                                      eps=config.rms_norm_eps)
+        self.pre_feedforward_layernorm = AscendRMSNorm(config.hidden_size,
+                                                       eps=config.rms_norm_eps)
         self.post_feedforward_layernorm = AscendRMSNorm(
             config.hidden_size, eps=config.rms_norm_eps)