prometheus-eval

university

AI & ML interests

None defined yet.

Recent Activity

hyungjoochae authored a paper 6 days ago

LEGO-Eval: Towards Fine-Grained Evaluation on Synthesizing 3D Embodied Environments with Tool Augmentation

itsnamgyu authored a paper 4 months ago

Cross-Modal Retrieval Meets Inference:Improving Zero-Shot Classification with Cross-Modal Retrieval

itsnamgyu authored a paper 4 months ago

Large Language Models Are Reasoning Teachers

View all activity

prometheus-eval 's datasets 16

prometheus-eval/bon_n8_setting_mmlu_pro_econ_eng_law_200

Viewer • Updated Jul 29 • 9.6k • 10

prometheus-eval/bon_setting_mmlu_pro_econ_eng_law_200

Viewer • Updated Jul 29 • 76.8k • 21

prometheus-eval/BiGGen-Bench

Viewer • Updated Apr 3 • 765 • 80 • 16

prometheus-eval/filtered_bon_setting_deepseek_distill_7b

Viewer • Updated Mar 7 • 7.23k • 10

prometheus-eval/filtered_bon_setting_64

Viewer • Updated Mar 2 • 305k • 10

prometheus-eval/outcome_meta_evaluation

Viewer • Updated Jan 27 • 18.1k • 12 • 2

prometheus-eval/outcome_meta_evaluation_heuristic

Viewer • Updated Jan 18 • 18.1k • 15

prometheus-eval/MMQA

Viewer • Updated Nov 18, 2024 • 330 • 22 • 3

prometheus-eval/MM-Eval

Viewer • Updated Oct 26, 2024 • 11.1k • 195 • 5

prometheus-eval/BiGGen-Bench-Results

Viewer • Updated Aug 12, 2024 • 76.6k • 372 • 11

prometheus-eval/Preference-Collection

Viewer • Updated May 3, 2024 • 200k • 389 • 36

prometheus-eval/Preference-Bench

Viewer • Updated Apr 6, 2024 • 2k • 51 • 2

prometheus-eval/Feedback-Bench

Viewer • Updated Apr 6, 2024 • 1k • 110 • 4

prometheus-eval/Perception-Bench

Viewer • Updated Jan 15, 2024 • 500 • 64 • 4

prometheus-eval/Perception-Collection

Viewer • Updated Jan 15, 2024 • 150k • 110 • 8

prometheus-eval/Feedback-Collection

Viewer • Updated Oct 14, 2023 • 100k • 323 • 115