gguf-my-repo

Sleeping

Oleg Shulyakov commited on 24 days ago

Commit

fca7ea4

1 Parent(s): c1ffdc3

Add F16 and BF16 quantization

Files changed (1) hide show

app.py CHANGED Viewed

@@ -332,7 +332,7 @@ model_id = HuggingfaceHubSearch(
 )
 q_method = gr.Dropdown(
-    ["Q2_K", "Q3_K_S", "Q3_K_M", "Q3_K_L", "Q4_0", "Q4_K_S", "Q4_K_M", "Q5_0", "Q5_K_S", "Q5_K_M", "Q6_K", "Q8_0"],
     label="Quantization Method",
     info="GGML quantization type",
     value="Q4_K_M",

 )
 q_method = gr.Dropdown(
+    ["Q2_K", "Q3_K_S", "Q3_K_M", "Q3_K_L", "Q4_0", "Q4_K_S", "Q4_K_M", "Q5_0", "Q5_K_S", "Q5_K_M", "Q6_K", "Q8_0", "F16", "BF16"],
     label="Quantization Method",
     info="GGML quantization type",
     value="Q4_K_M",