Spaces:

evalitahf
/

evalita_llm_leaderboard

Running

App Files Files Community

evalita_llm_leaderboard / preprocess_models_output.py

Commit History

Added computation and display of the standard deviation across individual prompt accuracy values for each task

67324c2

Running

rzanoli commited on 22 days ago

Small changes

5a8f6c4

rzanoli commited on Mar 26

Small changes

dbd3b18

rzanoli commited on Mar 25

Add new scripts for model processing and tasks management

ad489d5

rzanoli commited on Mar 18