Spaces:

HemanM
/

EvoConvo

Sleeping

HemanM commited on about 1 month ago

Commit

ef57a4b

verified ·

1 Parent(s): 56c5819

Update generate.py

Files changed (1) hide show

generate.py CHANGED Viewed

@@ -1,17 +1,22 @@
 import torch
 import torch.nn.functional as F
-from evo_model import EvoDecoder
 from transformers import GPT2Tokenizer
 tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model = EvoDecoder(
     vocab_size=tokenizer.vocab_size,
     d_model=256,
     nhead=4,
     num_layers=3,
-    dim_feedforward=512  # ✅ Must match the trained model
 ).to(device)
 model.load_state_dict(torch.load("evo_decoder.pt", map_location=device))

+# generate.py
 import torch
 import torch.nn.functional as F
 from transformers import GPT2Tokenizer
+from evo_decoder import EvoDecoder
+# Load tokenizer
 tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
+tokenizer.pad_token = tokenizer.eos_token  # Safe default
+# Load model
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model = EvoDecoder(
     vocab_size=tokenizer.vocab_size,
     d_model=256,
     nhead=4,
     num_layers=3,
+    dim_feedforward=512
 ).to(device)
 model.load_state_dict(torch.load("evo_decoder.pt", map_location=device))