Spaces:
Running
Running
name,zero_naive,zero_self_con,zero_cot,zero_cot_self_con,few_naive,few_self_con,few_cot,few_cot_self_con | |
Baichuan2-13B-Chat,6.67,10.0,23.33,23.33,16.67,20.0,26.67,30.0 | |
ChatGLM3-6B,13.33333333,13.33333333,16.66666667,16.66666667,6.666666667,6.666666667,13.33333333,13.33333333 | |
DevOps-Model-14B-Chat,16.67,16.67,33.33,13.33,40.0,40.0,20.0,23.33 | |
ERNIE-Bot-4.0,16.67,16.67,20.0,20.0,36.67,36.67,23.33,23.33 | |
GPT-3.5-turbo,13.33,13.33,20.0,26.67,20.0,20.0,16.67,23.33 | |
GPT-4,20.0,20.0,20.0,20.0,43.33,43.33,46.67,46.67 | |
InternLM2-Chat-20B,13.33333333,13.33333333,20.0,20.0,16.66666667,16.66666667,, | |
InternLM2-Chat-7B,43.33333333,43.33333333,23.33333333,23.33333333,30.0,30.0,40.0,40.0 | |
LLaMA-2-13B,10.0,10.0,20.0,20.0,26.67,26.67,13.33,13.33 | |
LLaMA-2-70B-Chat,3.33,3.33,20.0,20.0,23.33,23.33,16.67,16.67 | |
LLaMA-2-7B,10.0,10.0,26.67,26.67,16.67,16.67,33.33,33.33 | |
Mistral-7B,0.0,0.0,23.33,23.33,0.0,0.0,16.67,16.67 | |
Qwen-14B-Chat,13.33,13.33,20.0,26.67,40.0,30.0,26.67,33.33 | |
Qwen-72B-Chat,36.67,36.67,33.33,33.33,43.33,43.33,33.33,36.67 | |
Yi-34B-Chat,36.67,40.0,36.67,30.0,50.0,46.67,30.0,43.33 | |
JIUTIAN-75B-net,65.0,65.0,70.0,70.0,50.0,50.0,75.0,75.0 | |
Claude-3-Opus,55.0,55.0,,,,,, | |
Deepseek-R1-Distill-Llama-8B,10.0,10.0,30.0,30.0,35.0,35.0,27.5,27.5 | |
Deepseek-R1-Distill-Qwen-1.5B,25.0,25.0,5.0,5.0,32.5,32.5,20.0,20.0 | |
Deepseek-R1-Distill-Qwen-14B,50.0,50.0,,,60.0,60.0,, | |
Deepseek-R1-Distill-Qwen-32B,60.0,60.0,,,62.5,62.5,, | |
Deepseek-R1-Distill-Qwen-7B,10.0,10.0,22.5,22.5,35.0,35.0,32.5,32.5 | |
Gemma-2B,26.66667,26.66667,10.0,10.0,26.66667,26.66667,20.0,20.0 | |
Gemma-7B,3.333333,3.333333,23.33333,23.33333,13.33333,13.33333,30.0,30.0 | |
Meta-Llama-3-8B-Instruct,27.5,27.5,22.5,22.5,30.0,30.0,30.0,30.0 | |
Qwen1.5-14B-Base,20.0,20.0,33.33333,33.33333,20.0,20.0,30.0,30.0 | |
Qwen1.5-14B-Chat,23.33333,26.66667,13.33333,13.33333,26.66667,26.66667,20.0,30.0 | |