[https://nvbugs/5496960][fix] Fix Gemma model forward. (#7509)

hyukn · web-flow · commit e07fa9ddc5cf · 2025-09-04T19:09:43.000+08:00
Signed-off-by: Yukun He &lt;23156053+hyukn@users.noreply.github.com&gt;
diff --git a/tensorrt_llm/models/gemma/model.py b/tensorrt_llm/models/gemma/model.py
@@ -157,10 +157,13 @@ def forward(self,
                 if default_net().plugin_config.reduce_fusion else
                 AllReduceFusionOp.NONE,
                 residual=residual,
-                norm_weight=self.pre_feedforward_layernorm.weight.value,
-                norm_pre_residual_weight=self.post_layernorm.weight.value
+                norm_weight=self.pre_feedforward_layernorm.weight.value
                 if self.config.inter_layernorms else None,
-                eps=self.pre_feedforward_layernorm.eps))
+                norm_pre_residual_weight=self.post_layernorm.weight.value,
+                eps=self.pre_feedforward_layernorm.eps
+                if self.config.inter_layernorms else 1e-06,
+            ),
+        )
 
         if use_cache:
             attention_output, presents = attention_output