@reaatech/agent-eval-harness-gate

End-to-end agent evaluation — trajectory eval, tool-use correctness, cost-per-task, latency budgets, regression suites with golden trajectories, LLM-as-judge with calibration. For full agent runs, not just classifiers.

Latest release: 1d ago
Releases: 2
Known CVEs: 0
First release: May 04, 2026
License: MIT

View on Npm

Repository

Source

reaatech/agent-eval-harness

Stars: 0
Forks: 0
Open issues: 1
Language: TypeScript

agent-evaluation
agentic-ai
ai-agents
cost-tracking
latency
llm-as-a-judge
llm-as-judge
llm-eval

Security score

No OpenSSF Scorecard available for this repository.

Packages from this repo

Insights

Activity

Total releases: 2
Last 12 months: 2
Cadence: ~35 days
Dependencies: 3

Releases per month

last 12 months

Release mix

patch 1

2 releases

Dependencies

Depends on

0.1.1

@reaatech/agent-eval-harness-suite 0.1.1
@reaatech/agent-eval-harness-types 0.1.0
yaml ^2.8.4

Used by

Releases

Version	Released
`0.1.1` patch	Jun 09, 2026
`0.1.0` initial	May 04, 2026

Release calendar

2026

S M T W T F S

Jan

Feb

Mar

Apr

May

Jun

Jul

Aug

Sep

Oct

Nov

Dec