Spaces:

rodrigomasini
/

rephrase

Paused

rodrigomasini commited on Nov 2, 2023

Commit

1d7c581

1 Parent(s): 229fec7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,31 @@
 import gradio as gr
-demo = gr.load("FPHam/Jackson_The_Formalizer_V2_13b_GPTQ", src="models")
 demo.launch()

 import gradio as gr
+from transformers import AutoTokenizer, pipeline, logging
+from auto_gptq import AutoGPTQForCausalLM, BaseQuantizeConfig
+import argparse
+quantized_model_dir = "FPHam/Jackson_The_Formalizer_V2_13b_GPTQ"
+model_basename = "Jackson2-4bit-128g-GPTQ.safetensors"
+use_strict = False
+use_triton = False
+tokenizer = AutoTokenizer.from_pretrained(quantized_model_dir, use_fast=True)
+quantize_config = BaseQuantizeConfig(
+        bits=4,
+        group_size=128,
+        desc_act=False
+    )
+model = AutoGPTQForCausalLM.from_quantized(quantized_model_dir,
+        use_safetensors=True,
+        strict=use_strict,
+        model_basename=model_basename,
+        device="cuda:0",
+        use_triton=use_triton,
+        quantize_config=quantize_config)
 demo.launch()