Spaces:

ybchen928
/

oncall-guide-ai

Running

App Files Files Community

oncall-guide-ai / evaluation /direct_llm_evaluator.py

Commit History

Enhance direct LLM evaluation with retry mechanism for 504 timeouts and improved guidance format

3edd46d

YanBoChen commited on Aug 6

Update query file references for full evaluation and correct typo in pre_user_query_evaluate.txt for pre-test.

e84171b

YanBoChen commited on Aug 6

Enhance Direct LLM Evaluator and Judge Evaluator:

40d39ed

YanBoChen commited on Aug 5

Add multi-system evaluation support for clinical actionability and evidence quality metrics

16a2990

YanBoChen commited on Aug 5

feat: Add Extraction, LLM Judge, and Relevance Chart Generators

17613c8

YanBoChen commited on Aug 5