[OpenVINO backend] support triu [OpenVINO backend] support tri, triu, and tril

Mohamed-Ashraf273 · Mohamed-Ashraf273 · commit 96408fac6911 · 2025-06-22T17:59:47.000+03:00
diff --git a/keras/src/backend/openvino/excluded_concrete_tests.txt b/keras/src/backend/openvino/excluded_concrete_tests.txt
@@ -1,6 +1,5 @@
 NumPyTestRot90
 NumpyArrayCreateOpsCorrectnessTest::test_eye
-NumpyArrayCreateOpsCorrectnessTest::test_tri
 NumpyDtypeTest::test_absolute_bool
 NumpyDtypeTest::test_add_
 NumpyDtypeTest::test_all
@@ -60,7 +59,6 @@ NumpyDtypeTest::test_take_along_axis
 NumpyDtypeTest::test_tensordot_
 NumpyDtypeTest::test_tile
 NumpyDtypeTest::test_trace
-NumpyDtypeTest::test_tri
 NumpyDtypeTest::test_trunc
 NumpyDtypeTest::test_unravel
 NumpyDtypeTest::test_var
@@ -124,9 +122,6 @@ NumpyOneInputOpsCorrectnessTest::test_swapaxes
 NumpyOneInputOpsCorrectnessTest::test_tile
 NumpyOneInputOpsCorrectnessTest::test_trace
 NumpyOneInputOpsCorrectnessTest::test_transpose
-NumpyOneInputOpsCorrectnessTest::test_tril
-NumpyOneInputOpsCorrectnessTest::test_tril_in_layer
-NumpyOneInputOpsCorrectnessTest::test_triu
 NumpyOneInputOpsCorrectnessTest::test_trunc
 NumpyOneInputOpsCorrectnessTest::test_unravel_index
 NumpyOneInputOpsCorrectnessTest::test_var
diff --git a/keras/src/backend/openvino/numpy.py b/keras/src/backend/openvino/numpy.py
@@ -1484,15 +1484,226 @@ def trace(x, offset=0, axis1=0, axis2=1):
 
 
 def tri(N, M=None, k=0, dtype=None):
-    raise NotImplementedError("`tri` is not supported with openvino backend")
+    if M is None:
+        M = N
+    if dtype is None:
+        dtype = "float32"
+
+    ov_dtype = OPENVINO_DTYPES[dtype]
+
+    N = ov_opset.constant(N, Type.i32)
+    M = ov_opset.constant(M, Type.i32)
+    k = ov_opset.constant(k, Type.i32)
+
+    row_range = ov_opset.range(
+        ov_opset.constant(0, Type.i32),
+        N,
+        ov_opset.constant(1, Type.i32),
+        output_type=Type.i32,
+    )
+    col_range = ov_opset.range(
+        ov_opset.constant(0, Type.i32),
+        M,
+        ov_opset.constant(1, Type.i32),
+        output_type=Type.i32,
+    )
+
+    row_idx = ov_opset.unsqueeze(row_range, ov_opset.constant([1], Type.i32))
+    col_idx = ov_opset.unsqueeze(col_range, ov_opset.constant([0], Type.i32))
+
+    target_shape = ov_opset.concat(
+        [ov_opset.unsqueeze(N, [0]), ov_opset.unsqueeze(M, [0])], axis=0
+    )
+
+    row_idx = ov_opset.broadcast(row_idx, target_shape)
+    col_idx = ov_opset.broadcast(col_idx, target_shape)
+
+    mask = ov_opset.less_equal(col_idx, ov_opset.add(row_idx, k))
+
+    if ov_dtype == Type.boolean:
+        result = mask
+    else:
+        result = ov_opset.convert(mask, ov_dtype)
+
+    return OpenVINOKerasTensor(result.output(0))
 
 
 def tril(x, k=0):
-    raise NotImplementedError("`tril` is not supported with openvino backend")
+    def get_shape_dims(x):
+        shape = ov_opset.shape_of(x, Type.i32)
+        rank_tensor = ov_opset.shape_of(shape, Type.i32)
+        rank_scalar = ov_opset.squeeze(
+            rank_tensor, ov_opset.constant([0], Type.i32)
+        )
+        indices = ov_opset.range(
+            ov_opset.constant(0, Type.i32),
+            rank_scalar,
+            ov_opset.constant(1, Type.i32),
+            output_type=Type.i32,
+        )
+        return ov_opset.gather(shape, indices, axis=0)
+
+    x = get_ov_output(x)
+    ov_type = x.get_element_type()
+    input_shape = ov_opset.shape_of(x, Type.i32)
+    shape = get_shape_dims(x)
+
+    zero_const = ov_opset.constant(0, Type.i32)
+    minus2 = ov_opset.constant([-2], Type.i32)
+    minus1 = ov_opset.constant([-1], Type.i32)
+
+    M = ov_opset.squeeze(
+        ov_opset.gather(shape, minus2, zero_const),
+        ov_opset.constant([0], Type.i32),
+    )
+    N = ov_opset.squeeze(
+        ov_opset.gather(shape, minus1, zero_const),
+        ov_opset.constant([0], Type.i32),
+    )
+
+    row_range = ov_opset.range(
+        ov_opset.constant(0, Type.i32),
+        M,
+        ov_opset.constant(1, Type.i32),
+        output_type=Type.i32,
+    )
+    col_range = ov_opset.range(
+        ov_opset.constant(0, Type.i32),
+        N,
+        ov_opset.constant(1, Type.i32),
+        output_type=Type.i32,
+    )
+
+    row_idx = ov_opset.unsqueeze(row_range, ov_opset.constant([1], Type.i32))
+    col_idx = ov_opset.unsqueeze(col_range, ov_opset.constant([0], Type.i32))
+
+    M_1d = ov_opset.unsqueeze(M, ov_opset.constant([0], Type.i32))
+    N_1d = ov_opset.unsqueeze(N, ov_opset.constant([0], Type.i32))
+    target_shape = ov_opset.concat([M_1d, N_1d], axis=0)
+
+    row_idx = ov_opset.broadcast(row_idx, target_shape)
+    col_idx = ov_opset.broadcast(col_idx, target_shape)
+
+    k_const = ov_opset.constant(k, Type.i32)
+    mask = ov_opset.less_equal(col_idx, ov_opset.add(row_idx, k_const))
+    mask = ov_opset.convert(mask, ov_type)
+
+    shape_rank_tensor = ov_opset.shape_of(input_shape, Type.i32)
+    shape_rank = ov_opset.squeeze(
+        shape_rank_tensor, ov_opset.constant([0], Type.i32)
+    )
+    batch_dims_count = ov_opset.subtract(
+        shape_rank, ov_opset.constant(2, Type.i32)
+    )
+    batch_dims_count = ov_opset.squeeze(
+        batch_dims_count, ov_opset.constant([0], Type.i32)
+    )
+
+    batch_indices = ov_opset.range(
+        start=ov_opset.constant(0, Type.i32),
+        stop=batch_dims_count,
+        step=ov_opset.constant(1, Type.i32),
+        output_type=Type.i32,
+    )
+
+    batch_shape = ov_opset.gather(input_shape, batch_indices, axis=0)
+    full_mask_shape = ov_opset.concat([batch_shape, M_1d, N_1d], axis=0)
+    mask = ov_opset.broadcast(mask, full_mask_shape)
+
+    if ov_type == Type.boolean:
+        out = ov_opset.logical_and(x, mask)
+    else:
+        out = ov_opset.multiply(x, mask)
+    return OpenVINOKerasTensor(out.output(0))
 
 
 def triu(x, k=0):
-    raise NotImplementedError("`triu` is not supported with openvino backend")
+    def get_shape_dims(x):
+        shape = ov_opset.shape_of(x, Type.i32)
+        rank_tensor = ov_opset.shape_of(shape, Type.i32)
+        rank_scalar = ov_opset.squeeze(
+            rank_tensor, ov_opset.constant([0], Type.i32)
+        )
+        indices = ov_opset.range(
+            ov_opset.constant(0, Type.i32),
+            rank_scalar,
+            ov_opset.constant(1, Type.i32),
+            output_type=Type.i32,
+        )
+        return ov_opset.gather(shape, indices, axis=0)
+
+    x = get_ov_output(x)
+    ov_type = x.get_element_type()
+    input_shape = ov_opset.shape_of(x, Type.i32)
+    shape = get_shape_dims(x)
+
+    zero_const = ov_opset.constant(0, Type.i32)
+    minus2 = ov_opset.constant([-2], Type.i32)
+    minus1 = ov_opset.constant([-1], Type.i32)
+
+    M = ov_opset.squeeze(
+        ov_opset.gather(shape, minus2, zero_const),
+        ov_opset.constant([0], Type.i32),
+    )
+    N = ov_opset.squeeze(
+        ov_opset.gather(shape, minus1, zero_const),
+        ov_opset.constant([0], Type.i32),
+    )
+
+    row_range = ov_opset.range(
+        ov_opset.constant(0, Type.i32),
+        M,
+        ov_opset.constant(1, Type.i32),
+        output_type=Type.i32,
+    )
+    col_range = ov_opset.range(
+        ov_opset.constant(0, Type.i32),
+        N,
+        ov_opset.constant(1, Type.i32),
+        output_type=Type.i32,
+    )
+
+    row_idx = ov_opset.unsqueeze(row_range, ov_opset.constant([1], Type.i32))
+    col_idx = ov_opset.unsqueeze(col_range, ov_opset.constant([0], Type.i32))
+
+    M_1d = ov_opset.unsqueeze(M, ov_opset.constant([0], Type.i32))
+    N_1d = ov_opset.unsqueeze(N, ov_opset.constant([0], Type.i32))
+    target_shape = ov_opset.concat([M_1d, N_1d], axis=0)
+
+    row_idx = ov_opset.broadcast(row_idx, target_shape)
+    col_idx = ov_opset.broadcast(col_idx, target_shape)
+
+    k_const = ov_opset.constant(k, Type.i32)
+    mask = ov_opset.greater_equal(col_idx, ov_opset.add(row_idx, k_const))
+    mask = ov_opset.convert(mask, ov_type)
+
+    shape_rank_tensor = ov_opset.shape_of(input_shape, Type.i32)
+    shape_rank = ov_opset.squeeze(
+        shape_rank_tensor, ov_opset.constant([0], Type.i32)
+    )
+    batch_dims_count = ov_opset.subtract(
+        shape_rank, ov_opset.constant(2, Type.i32)
+    )
+    batch_dims_count = ov_opset.squeeze(
+        batch_dims_count, ov_opset.constant([0], Type.i32)
+    )
+
+    batch_indices = ov_opset.range(
+        start=ov_opset.constant(0, Type.i32),
+        stop=batch_dims_count,
+        step=ov_opset.constant(1, Type.i32),
+        output_type=Type.i32,
+    )
+
+    batch_shape = ov_opset.gather(input_shape, batch_indices, axis=0)
+    full_mask_shape = ov_opset.concat([batch_shape, M_1d, N_1d], axis=0)
+    mask = ov_opset.broadcast(mask, full_mask_shape)
+
+    if ov_type == Type.boolean:
+        out = ov_opset.logical_and(x, mask)
+    else:
+        out = ov_opset.multiply(x, mask)
+    return OpenVINOKerasTensor(out.output(0))
 
 
 def vdot(x1, x2):