all runs

Evaluation runs

Every `panoptes eval` invocation produces one run row. Smoke-test runs are listed but drill-down pages focus on the substantive ones (≥10 items).

panoptes-44c4e9b3

strategy: all

2026-06-04 18:45:08 · demo_calibration.duckdb

2026-06-04 18:12:07 · demo_calibration.duckdb

2026-06-04 17:54:12 · demo_bandit.duckdb

claude-haikuclaude-sonnetgpt-4o-mini

panoptes-49fdaed9

strategy: all

2026-06-04 17:42:29 · demo_all.duckdb

claude-haikuclaude-sonnetgpt-4o-mini

panoptes-696da4d5

strategy: all

2026-06-04 16:31:35 · demo_all.duckdb

claude-haikuclaude-sonnetgpt-4o-mini

panoptes-d7da27b1

strategy: all

2026-05-11 16:52:17 · m1_exit.duckdb