Spaces:

crossingminds
/

iclerb

Runtime error

App Files Files Community

cwchen-cm commited on Nov 27, 2024

Commit

a10fd08

1 Parent(s): 949853a

Initial commit

Browse files

Files changed (2) hide show

app.py +40 -0
results.csv +28 -0

app.py ADDED Viewed

	@@ -0,0 +1,40 @@

+# app.py
+import gradio as gr
+import pandas as pd
+# CSS for layout styling
+css = """
+table > thead {
+    white-space: normal
+}
+table {
+    --cell-width-1: 250px
+}
+table > tbody > tr > td:nth-child(2) > div {
+    overflow-x: auto
+}
+.filter-checkbox-group {
+    max-width: max-content;
+}
+"""
+# Load dataset
+def load_data():
+    # load dataset from csv file
+    df = pd.read_csv("results.csv")
+    return df
+df = load_data()
+with gr.Blocks(css=css) as demo:
+    gr.Markdown("# In-Context Learning Embedding and Reranker Benchmark (ICLERB) Leaderboard")
+    gr.Markdown("## Introduction\nIn-Context Learning Embedding and Rerankers Benchmark (ICLERB) is a benchmark to evaluate embedding and reranking models used to retrieve examples for In-Context Learning (ICL). The methodology is described in this [paper](). ")
+    gr.Markdown("## Leaderboard")
+    gr.Dataframe(df)
+    gr.Markdown("## Replicating results\nThe code used to generate these results will be shared on Github soon.")
+    gr.Markdown("## Acknowledgements\nICLERB was developed at [Crossing Minds](https://www.crossingminds.com/iclerb) by:")
+    gr.Markdown("- [Marie Al Ghossein](https://www.linkedin.com/in/mariealghossein/)")
+    gr.Markdown("- [Emile Contal](https://www.linkedin.com/in/emile-contal-72837652/)")
+demo.launch()

results.csv ADDED Viewed

	@@ -0,0 +1,28 @@

+Organization,Model,Model Size (Parameters),nDCG@10,nDCG@50
+Crossing Minds,cm-rerank-mxbai-rlaif-v0.1,335M,0.7238,0.7225
+BAAI,bge-en-icl,7.1B,0.7192,0.7081
+nvidia,NV-Embed-v2,7.85B,0.7078,0.6998
+Salesforce,SFR-Embedding-2_R,7.1B,0.6925,0.6859
+Alibaba NLP,gte-Qwen2-7B-instruct,7.6B,0.6877,0.6837
+Cohere,embed-english-v3.0,N/A,0.6876,0.6831
+nvidia,NV-Retriever-v1,7.1B,0.6878,0.6829
+dunzhang,stella_en_1.5B_v5,1.5B,0.6885,0.6828
+Alibaba NLP,gte-Qwen2-1.5B-instruct,1.8B,0.6865,0.6825
+mixedbread ai,mxbai-embed-large-v1,335M,0.6787,0.6782
+OpenAI,text-embedding-3-large,N/A,0.6818,0.6774
+mixedbread ai,mxbai-embed-large-v1@384,335M,0.6757,0.6756
+OpenAI,text-embedding-3-small,N/A,0.6787,0.6740
+Linq AI Research,Linq-Embed-Mistral,7.1B,0.6793,0.6731
+Snowflake,snowflake-arctic-embed-s,33M,0.6715,0.6684
+zeta alpha ai,Zeta-Alpha-E5-Mistral,7.1B,0.6704,0.6672
+sentence transformers,sentence-transformers/all-MiniLM-L6-v2,23M,0.6672,0.6665
+Voyage AI,voyage-3-lite,N/A,0.6681,0.6660
+sentence transformers,multi-qa-distilbert-cos-v1,66M,0.6660,0.6657
+sentence transformers,multi-qa-MiniLM-L6-cos-v1,23M,0.6650,0.6652
+sentence transformers,all-mpnet-base-v2,110M,0.6655,0.6650
+sentence transformers,all-MiniLM-L12-v2,33M,0.6651,0.6646
+Snowflake,snowflake-arctic-embed-l,334M,0.6686,0.6641
+sentence transformers,multi-qa-mpnet-base-dot-v1,109M,0.6645,0.6639
+Snowflake,snowflake-arctic-embed-m-v1.5,109M,0.6646,0.6630
+Cohere,rerank-english-v3.0,N/A,0.6679,0.6604
+Voyage AI,rerank-2,N/A,0.6386,0.6432