Spaces:

rodrigomasini
/

rephrase

Paused

rodrigomasini commited on Nov 7, 2023

Commit

cb0f371

1 Parent(s): 85bb959

Update app_v3.py

Files changed (1) hide show

app_v3.py CHANGED Viewed

@@ -19,7 +19,7 @@ pretrained_model_dir = "FPHam/Jackson_The_Formalizer_V2_13b_GPTQ"
 #st.write(f'{os.listdir(quantized_model_dir)}')
 #model_name_or_path = quantized_model_dir
-#model_basename = "Jackson2-4bit-128g-GPTQ"
 #os.environ['CUDA_VISIBLE_DEVICES'] = '0'
@@ -33,7 +33,7 @@ use_triton = False
 tokenizer = AutoTokenizer.from_pretrained(pretrained_model_dir, use_fast=True)
 model = AutoGPTQForCausalLM.from_quantized(
     pretrained_model_dir,
-    #model_basename=model_basename,
     use_safetensors=True,
     device="cuda:0",
     #use_triton=use_triton,

 #st.write(f'{os.listdir(quantized_model_dir)}')
 #model_name_or_path = quantized_model_dir
+model_basename = "Jackson2-4bit-128g-GPTQ"
 #os.environ['CUDA_VISIBLE_DEVICES'] = '0'
 tokenizer = AutoTokenizer.from_pretrained(pretrained_model_dir, use_fast=True)
 model = AutoGPTQForCausalLM.from_quantized(
     pretrained_model_dir,
+    model_basename=model_basename,
     use_safetensors=True,
     device="cuda:0",
     #use_triton=use_triton,