mehtamansi29
diff --git a/‎keras_hub/api/models/__init__.py‎
Lines changed: 12 additions & 0 deletions b/‎keras_hub/api/models/__init__.py‎
Lines changed: 12 additions & 0 deletions
diff --git a/‎keras_hub/src/models/qwen3/qwen3_attention.py‎
Lines changed: 1 addition & 1 deletion b/‎keras_hub/src/models/qwen3/qwen3_attention.py‎
Lines changed: 1 addition & 1 deletion
@@ -322,7 +322,19 @@
 from keras_hub.src.models.qwen.qwen_tokenizer import (
     QwenTokenizer as Qwen2Tokenizer,
 )
+<<<<<<< HEAD
 from keras_hub.src.models.qwen3.qwen3_backbone import Qwen3Backbone
+=======
+from keras_hub.src.models.qwen.qwen_tokenizer import (
+    QwenTokenizer as QwenTokenizer,
+)
+from keras_hub.src.models.qwen3.qwen3_backbone import (
+    Qwen3Backbone as Qwen3Backbone,
+)
+from keras_hub.src.models.qwen3.qwen3_causal_lm import (
+    Qwen3CausalLM as Qwen3CausalLM,
+)
+>>>>>>> 5fd34b15 (Qwen3 causal lm (#2311))
 from keras_hub.src.models.qwen3.qwen3_causal_lm_preprocessor import (
     Qwen3CausalLMPreprocessor,
 )
 
@@ -303,7 +303,7 @@ def _compute_attention(
             attention_mask = self._mask_sliding_window(
                 attention_mask,
                 cache_update_index=cache_update_index
-                if cache_update_index
+                if cache_update_index is not None
                 else 0,
             )
         attention_scores = self._masked_softmax(
Original file line number	Diff line number	Diff line change
`@@ -303,7 +303,7 @@ def _compute_attention(`
`303`	`303`	`attention_mask = self._mask_sliding_window(`
`304`	`304`	`attention_mask,`
`305`	`305`	`cache_update_index=cache_update_index`
`306`		`- if cache_update_index`
	`306`	`+ if cache_update_index is not None`
`307`	`307`	`else 0,`
`308`	`308`	`)`
`309`	`309`	`attention_scores = self._masked_softmax(`