Revised AI engineering docs (2) #473

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Open

dominicchapman wants to merge 32 commits into main from dominic/evals-plus-wider-edits-v2

Member

dominicchapman commented Nov 19, 2025 •

edited

Loading

New "evaluation" content:

Updated workflow language from "Measure" to "Evaluate" to better reflect our approach
Reorganized evaluation content into a dedicated section with six focused pages (overview, setup, write evaluations, flags & experiments, run evaluations, analyze results)

Other changes:

Concepts: Added definitions for flags and experiments; integrated AI capability architecture spectrum (single-turn → workflows → single-agent → multi-agent)
Create: De-emphasized experimental prompt management features while clarifying Axiom's current focus on evaluation and observability; added references to Vercel AI SDK examples and Mastra as framework alternatives
Iterate: Complete rewrite introducing the systematic improvement loop; added sections on user feedback capture and domain expert annotation workflows (marked as coming soon); reorganized failure categorization by severity for better prioritization
Quickstart: Updated to reference evaluation framework and CLI authentication; improved "What's next" guidance

c-ehrlich and others added 18 commits

November 11, 2025 15:50


          initial eval docs

2ae1a63


          add note about instrumentation fn

a082b90


          Stylistic fixes

7df0bdb


          Quick fixes


          Merge branch 'main' into evals-1

686a53e


          Fixes

7b8bd25


          Add keywords


          Restructure Measure page

2c662b2


          Implement review

95d4c5c


          Refactor

55e6bf4


          Update measure.mdx

3e3050c


          Update measure.mdx

89ce5ca


          docs: concepts and definitions

ad26f30


          docs: update overview

d6a1130


          docs: new evaluate section

55703d9


          docs: create, evaluate/overview, remove measure from docs.json

c6d33c1


          docs: revise iterate

9a26814


          docs: refinement

528cf1f

dominicchapman mentioned this pull request

Revised AI engineering docs #472

Closed

mintlify bot deployed to staging

November 19, 2025 10:08

View deployment

c-ehrlich reviewed

View reviewed changes

ai-engineering/concepts.mdx Show resolved Hide resolved

ai-engineering/concepts.mdx Outdated Show resolved Hide resolved

ai-engineering/concepts.mdx Outdated Show resolved Hide resolved

ai-engineering/concepts.mdx Outdated Show resolved Hide resolved

c-ehrlich reviewed

View reviewed changes

ai-engineering/overview.mdx Show resolved Hide resolved

ai-engineering/overview.mdx Show resolved Hide resolved

c-ehrlich reviewed

View reviewed changes

ai-engineering/quickstart.mdx Show resolved Hide resolved

c-ehrlich reviewed

View reviewed changes

ai-engineering/evaluate/analyze-results.mdx Outdated Show resolved Hide resolved

ai-engineering/evaluate/analyze-results.mdx Show resolved Hide resolved

ai-engineering/evaluate/flags-experiments.mdx Show resolved Hide resolved

ai-engineering/evaluate/flags-experiments.mdx Show resolved Hide resolved

ai-engineering/evaluate/flags-experiments.mdx Outdated Show resolved Hide resolved

ai-engineering/evaluate/flags-experiments.mdx Show resolved Hide resolved

ai-engineering/evaluate/flags-experiments.mdx Show resolved Hide resolved

ai-engineering/evaluate/flags-experiments.mdx Outdated Show resolved Hide resolved

ai-engineering/evaluate/flags-experiments.mdx Show resolved Hide resolved

ai-engineering/evaluate/run-evaluations.mdx Outdated Show resolved Hide resolved

c-ehrlich reviewed

View reviewed changes

ai-engineering/create.mdx Show resolved Hide resolved

c-ehrlich reviewed

View reviewed changes

ai-engineering/iterate.mdx Outdated Show resolved Hide resolved

c-ehrlich reviewed

View reviewed changes

ai-engineering/concepts.mdx Outdated Show resolved Hide resolved

c-ehrlich reviewed

View reviewed changes

ai-engineering/concepts.mdx Show resolved Hide resolved

c-ehrlich reviewed

View reviewed changes

ai-engineering/quickstart.mdx Show resolved Hide resolved

c-ehrlich reviewed

View reviewed changes

ai-engineering/create.mdx Show resolved Hide resolved

thesollyz reviewed

View reviewed changes

ai-engineering/evaluate/run-evaluations.mdx Outdated Show resolved Hide resolved

thesollyz reviewed

View reviewed changes

ai-engineering/evaluate/setup.mdx Show resolved Hide resolved


          docs: explain benefits of pickFlags

f62b30d

mintlify bot deployed to staging

November 20, 2025 14:34

View deployment


          docs: less focus on temperature

58becf6

mintlify bot deployed to staging

November 20, 2025 14:53

View deployment


          docs: remove duplicated content

687548f

mintlify bot deployed to staging

November 20, 2025 14:58

View deployment


          docs: remove 'reference' from concepts

cd7856e

mintlify bot deployed to staging

November 20, 2025 14:59

View deployment

dominicchapman added 2 commits

November 20, 2025 15:02


          docs: add model example to enum

42890d6


          docs: remove watch mode

1b6c8e7

mintlify bot deployed to staging

November 20, 2025 15:04

View deployment


          docs: remove marketing fluff

3b8e48f

mintlify bot deployed to staging

November 20, 2025 15:05

View deployment


          docs: evaluator > evaluation

e6e5c6c

mintlify bot deployed to staging

November 20, 2025 15:12

View deployment


          docs: default flags to production config

93bb44b

mintlify bot deployed to staging

November 20, 2025 15:24

View deployment


          docs: update concepts for completeness

4ff0249

mintlify bot deployed to staging

November 20, 2025 15:34

View deployment

dominicchapman added 2 commits

November 20, 2025 17:16


          docs: run-id feedback

aad74a6


          Merge branch 'main' into dominic/evals-plus-wider-edits-v2

mintlify bot deployed to staging

November 20, 2025 17:32

View deployment

mintlify bot deployed to staging

November 20, 2025 17:33

View deployment

gabrielelpidio approved these changes

View reviewed changes

This was referenced Nov 21, 2025

Update Measure in AI eng #465

Closed

Add evals to AI engineering #469

Closed


          update createAppScope import

fd2ac49

mintlify bot deployed to staging

November 25, 2025 09:10

View deployment

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet