phi3-api-local

Paused

muryshev commited on May 27, 2024

Commit

96cde50

verified ·

1 Parent(s): 39ad741

Update: input tokens are on the same device as a model

Files changed (1) hide show

model.py CHANGED Viewed

@@ -18,7 +18,7 @@ async def get_answer_from_llm(question: str = None):
     messages = [{"role": "user", "content": f"{question}"}]
     input_ids = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt")
     gen_tokens = model.generate(
-        input_ids,
         max_new_tokens=100,
         do_sample=True,
         temperature=0.3,

     messages = [{"role": "user", "content": f"{question}"}]
     input_ids = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt")
     gen_tokens = model.generate(
+        input_ids.to(device),
         max_new_tokens=100,
         do_sample=True,
         temperature=0.3,