cleanlab
diff --git a/‎.stats.yml
Lines changed: 2 additions & 2 deletions b/‎.stats.yml
Lines changed: 2 additions & 2 deletions
diff --git a/‎api.md
Lines changed: 2 additions & 0 deletions b/‎api.md
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/codex/resources/projects/projects.py
Lines changed: 10 additions & 12 deletions b/‎src/codex/resources/projects/projects.py
Lines changed: 10 additions & 12 deletions
diff --git a/‎src/codex/resources/projects/query_logs.py
Lines changed: 101 additions & 1 deletion b/‎src/codex/resources/projects/query_logs.py
Lines changed: 101 additions & 1 deletion
diff --git a/‎src/codex/resources/tlm.py
Lines changed: 20 additions & 24 deletions b/‎src/codex/resources/tlm.py
Lines changed: 20 additions & 24 deletions
diff --git a/‎src/codex/types/project_validate_params.py
Lines changed: 7 additions & 6 deletions b/‎src/codex/types/project_validate_params.py
Lines changed: 7 additions & 6 deletions
diff --git a/‎src/codex/types/project_validate_response.py
Lines changed: 3 additions & 0 deletions b/‎src/codex/types/project_validate_response.py
Lines changed: 3 additions & 0 deletions
@@ -1,3 +1,3 @@
-configured_endpoints: 54
-openapi_spec_hash: 04e1b7aefbeff10daab249b153de147f
+configured_endpoints: 55
+openapi_spec_hash: d69252c7252423bc98ecc17807eb33ec
 config_hash: bed87752f4056d0c4bf2ddf856307800
@@ -202,6 +202,7 @@ Types:
 from codex.types.projects import (
     QueryLogRetrieveResponse,
     QueryLogListResponse,
+    QueryLogAddUserFeedbackResponse,
     QueryLogListByGroupResponse,
     QueryLogListGroupsResponse,
     QueryLogStartRemediationResponse,
@@ -212,6 +213,7 @@ Methods:
 
 - <code title="get /api/projects/{project_id}/query_logs/{query_log_id}">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">retrieve</a>(query_log_id, \*, project_id) -> <a href="./src/codex/types/projects/query_log_retrieve_response.py">QueryLogRetrieveResponse</a></code>
 - <code title="get /api/projects/{project_id}/query_logs/">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">list</a>(project_id, \*\*<a href="src/codex/types/projects/query_log_list_params.py">params</a>) -> <a href="./src/codex/types/projects/query_log_list_response.py">SyncOffsetPageQueryLogs[QueryLogListResponse]</a></code>
+- <code title="post /api/projects/{project_id}/query_logs/{query_log_id}/user_feedback">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">add_user_feedback</a>(query_log_id, \*, project_id, \*\*<a href="src/codex/types/projects/query_log_add_user_feedback_params.py">params</a>) -> <a href="./src/codex/types/projects/query_log_add_user_feedback_response.py">QueryLogAddUserFeedbackResponse</a></code>
 - <code title="get /api/projects/{project_id}/query_logs/logs_by_group">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">list_by_group</a>(project_id, \*\*<a href="src/codex/types/projects/query_log_list_by_group_params.py">params</a>) -> <a href="./src/codex/types/projects/query_log_list_by_group_response.py">QueryLogListByGroupResponse</a></code>
 - <code title="get /api/projects/{project_id}/query_logs/groups">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">list_groups</a>(project_id, \*\*<a href="src/codex/types/projects/query_log_list_groups_params.py">params</a>) -> <a href="./src/codex/types/projects/query_log_list_groups_response.py">SyncOffsetPageQueryLogGroups[QueryLogListGroupsResponse]</a></code>
 - <code title="post /api/projects/{project_id}/query_logs/{query_log_id}/start_remediation">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">start_remediation</a>(query_log_id, \*, project_id) -> <a href="./src/codex/types/projects/query_log_start_remediation_response.py">QueryLogStartRemediationResponse</a></code>
 
@@ -527,12 +527,11 @@ def validate(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
-              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
-              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
-              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
-              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
-              "nova-micro".
+              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
+              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
+              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
+              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
+              for low latency/costs: "gpt-4.1-nano", "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -1106,12 +1105,11 @@ async def validate(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
-              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
-              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
-              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
-              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
-              "nova-micro".
+              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
+              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
+              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
+              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
+              for low latency/costs: "gpt-4.1-nano", "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
 
@@ -25,11 +25,17 @@
     AsyncOffsetPageQueryLogGroups,
 )
 from ..._base_client import AsyncPaginator, make_request_options
-from ...types.projects import query_log_list_params, query_log_list_groups_params, query_log_list_by_group_params
+from ...types.projects import (
+    query_log_list_params,
+    query_log_list_groups_params,
+    query_log_list_by_group_params,
+    query_log_add_user_feedback_params,
+)
 from ...types.projects.query_log_list_response import QueryLogListResponse
 from ...types.projects.query_log_retrieve_response import QueryLogRetrieveResponse
 from ...types.projects.query_log_list_groups_response import QueryLogListGroupsResponse
 from ...types.projects.query_log_list_by_group_response import QueryLogListByGroupResponse
+from ...types.projects.query_log_add_user_feedback_response import QueryLogAddUserFeedbackResponse
 from ...types.projects.query_log_start_remediation_response import QueryLogStartRemediationResponse
 
 __all__ = ["QueryLogsResource", "AsyncQueryLogsResource"]
@@ -184,6 +190,46 @@ def list(
             model=QueryLogListResponse,
         )
 
+    def add_user_feedback(
+        self,
+        query_log_id: str,
+        *,
+        project_id: str,
+        key: str,
+        # Use the following arguments if you need to pass additional parameters to the API that aren't available via kwargs.
+        # The extra values given here take precedence over values defined on the client or passed to this method.
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | NotGiven = NOT_GIVEN,
+    ) -> QueryLogAddUserFeedbackResponse:
+        """
+        Add User Feedback Route
+
+        Args:
+          key: A key describing the criteria of the feedback, eg 'rating'
+
+          extra_headers: Send extra headers
+
+          extra_query: Add additional query parameters to the request
+
+          extra_body: Add additional JSON properties to the request
+
+          timeout: Override the client-level default timeout for this request, in seconds
+        """
+        if not project_id:
+            raise ValueError(f"Expected a non-empty value for `project_id` but received {project_id!r}")
+        if not query_log_id:
+            raise ValueError(f"Expected a non-empty value for `query_log_id` but received {query_log_id!r}")
+        return self._post(
+            f"/api/projects/{project_id}/query_logs/{query_log_id}/user_feedback",
+            body=maybe_transform({"key": key}, query_log_add_user_feedback_params.QueryLogAddUserFeedbackParams),
+            options=make_request_options(
+                extra_headers=extra_headers, extra_query=extra_query, extra_body=extra_body, timeout=timeout
+            ),
+            cast_to=QueryLogAddUserFeedbackResponse,
+        )
+
     def list_by_group(
         self,
         project_id: str,
@@ -568,6 +614,48 @@ def list(
             model=QueryLogListResponse,
         )
 
+    async def add_user_feedback(
+        self,
+        query_log_id: str,
+        *,
+        project_id: str,
+        key: str,
+        # Use the following arguments if you need to pass additional parameters to the API that aren't available via kwargs.
+        # The extra values given here take precedence over values defined on the client or passed to this method.
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | NotGiven = NOT_GIVEN,
+    ) -> QueryLogAddUserFeedbackResponse:
+        """
+        Add User Feedback Route
+
+        Args:
+          key: A key describing the criteria of the feedback, eg 'rating'
+
+          extra_headers: Send extra headers
+
+          extra_query: Add additional query parameters to the request
+
+          extra_body: Add additional JSON properties to the request
+
+          timeout: Override the client-level default timeout for this request, in seconds
+        """
+        if not project_id:
+            raise ValueError(f"Expected a non-empty value for `project_id` but received {project_id!r}")
+        if not query_log_id:
+            raise ValueError(f"Expected a non-empty value for `query_log_id` but received {query_log_id!r}")
+        return await self._post(
+            f"/api/projects/{project_id}/query_logs/{query_log_id}/user_feedback",
+            body=await async_maybe_transform(
+                {"key": key}, query_log_add_user_feedback_params.QueryLogAddUserFeedbackParams
+            ),
+            options=make_request_options(
+                extra_headers=extra_headers, extra_query=extra_query, extra_body=extra_body, timeout=timeout
+            ),
+            cast_to=QueryLogAddUserFeedbackResponse,
+        )
+
     async def list_by_group(
         self,
         project_id: str,
@@ -813,6 +901,9 @@ def __init__(self, query_logs: QueryLogsResource) -> None:
         self.list = to_raw_response_wrapper(
             query_logs.list,
         )
+        self.add_user_feedback = to_raw_response_wrapper(
+            query_logs.add_user_feedback,
+        )
         self.list_by_group = to_raw_response_wrapper(
             query_logs.list_by_group,
         )
@@ -834,6 +925,9 @@ def __init__(self, query_logs: AsyncQueryLogsResource) -> None:
         self.list = async_to_raw_response_wrapper(
             query_logs.list,
         )
+        self.add_user_feedback = async_to_raw_response_wrapper(
+            query_logs.add_user_feedback,
+        )
         self.list_by_group = async_to_raw_response_wrapper(
             query_logs.list_by_group,
         )
@@ -855,6 +949,9 @@ def __init__(self, query_logs: QueryLogsResource) -> None:
         self.list = to_streamed_response_wrapper(
             query_logs.list,
         )
+        self.add_user_feedback = to_streamed_response_wrapper(
+            query_logs.add_user_feedback,
+        )
         self.list_by_group = to_streamed_response_wrapper(
             query_logs.list_by_group,
         )
@@ -876,6 +973,9 @@ def __init__(self, query_logs: AsyncQueryLogsResource) -> None:
         self.list = async_to_streamed_response_wrapper(
             query_logs.list,
         )
+        self.add_user_feedback = async_to_streamed_response_wrapper(
+            query_logs.add_user_feedback,
+        )
         self.list_by_group = async_to_streamed_response_wrapper(
             query_logs.list_by_group,
         )
 
@@ -101,12 +101,11 @@ def prompt(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
-              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
-              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
-              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
-              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
-              "nova-micro".
+              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
+              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
+              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
+              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
+              for low latency/costs: "gpt-4.1-nano", "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -245,12 +244,11 @@ def score(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
-              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
-              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
-              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
-              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
-              "nova-micro".
+              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
+              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
+              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
+              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
+              for low latency/costs: "gpt-4.1-nano", "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -405,12 +403,11 @@ async def prompt(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
-              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
-              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
-              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
-              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
-              "nova-micro".
+              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
+              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
+              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
+              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
+              for low latency/costs: "gpt-4.1-nano", "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -549,12 +546,11 @@ async def score(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
-              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
-              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
-              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
-              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
-              "nova-micro".
+              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
+              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
+              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
+              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
+              for low latency/costs: "gpt-4.1-nano", "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
 
@@ -130,12 +130,11 @@ class ProjectValidateParams(TypedDict, total=False):
     "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
     "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
     (better models yield better results, faster models yield faster results). -
-    Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
-    "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
-    "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
-    models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
-    "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
-    "nova-micro".
+    Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
+    "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
+    "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
+    "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
+    for low latency/costs: "gpt-4.1-nano", "nova-micro".
 
         log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
         For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -653,6 +652,8 @@ class MessageChatCompletionDeveloperMessageParam(TypedDict, total=False):
 class Options(TypedDict, total=False):
     custom_eval_criteria: Iterable[object]
 
+    disable_persistence: bool
+
     disable_trustworthiness: bool
 
     log: List[str]
 
@@ -59,6 +59,9 @@ class ProjectValidateResponse(BaseModel):
     to answer, if it does not already exist.
     """
 
+    log_id: str
+    """The UUID of the query log entry created for this validation request."""
+
     should_guardrail: bool
     """
     True if the response should be guardrailed by the AI system, False if the