Spaces:

HemanM
/

EvoConvo

Sleeping

HemanM commited on Aug 4

Commit

738a56e

verified ·

1 Parent(s): defaa9b

Update generate.py

Files changed (1) hide show

generate.py CHANGED Viewed

@@ -24,6 +24,10 @@ def generate_response(prompt, use_web=False, max_length=100, top_k=40):
     input_text = context + f"User: {prompt}\nAssistant:"
     input_ids = tokenizer.encode(input_text, return_tensors="pt").to(device)
     for _ in range(max_length):
         with torch.no_grad():
             logits = model(input_ids)

     input_text = context + f"User: {prompt}\nAssistant:"
     input_ids = tokenizer.encode(input_text, return_tensors="pt").to(device)
+    # Truncate to avoid exceeding model's positional encoding limit
+    if input_ids.size(1) > 512:
+        input_ids = input_ids[:, -512:]
     for _ in range(max_length):
         with torch.no_grad():
             logits = model(input_ids)