Spaces:

DesiredName
/

test

Build error

DesiredName commited on Jul 28

Commit

e9ad359

verified ·

1 Parent(s): 4545ff6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,13 +1,11 @@
 from fastapi import FastAPI
 import uvicorn
-from awq import AutoAWQForCausalLM
-from transformers import AutoTokenizer
-model_name = "TheBloke/Guanaco-7B-Uncensored-AWQ"
-model = AutoAWQForCausalLM.from_quantized(model_name, fuse_layers=True,
-                                          trust_remote_code=False, safetensors=True)
-tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=False)
 tokenizer.pad_token = tokenizer.eos_token
 app = FastAPI()
@@ -18,20 +16,12 @@ def greet_json():
 @app.get("/message")
 async def message(input: str):
-    prompt=f'''### Human: {input}
-    ### Assistant:
-    '''
-    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True).input_ids.cpu()
     output = model.generate(
-        inputs,
-        do_sample=True,
-        temperature=0.7,
-        top_p=0.95,
-        top_k=40,
-        max_new_tokens=512
     )
     response = tokenizer.decode(output[0], skip_special_tokens=True)

 from fastapi import FastAPI
 import uvicorn
+from transformers import AutoTokenizer, AutoModel
+model_name = "TheBloke/Wizard-Vicuna-13B-Uncensored-HF"
+model = AutoModel.from_quantized(model_name, trust_remote_code=True)
+tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
 tokenizer.pad_token = tokenizer.eos_token
 app = FastAPI()
 @app.get("/message")
 async def message(input: str):
+    inputs = tokenizer(input, return_tensors="pt", padding=True, truncation=True)
     output = model.generate(
+        input_ids=inputs["input_ids"],
+        attention_mask=inputs["attention_mask"],
+        max_new_tokens=100,
     )
     response = tokenizer.decode(output[0], skip_special_tokens=True)