Spaces:

HemanM
/

EvoConvo

Sleeping

HemanM commited on 29 days ago

Commit

2dccd99

verified ·

1 Parent(s): 3d17dd0

Update evo_model.py

Files changed (1) hide show

evo_model.py CHANGED Viewed

@@ -32,6 +32,7 @@ class FeedForward(nn.Module):
         self.net = nn.Sequential(
             nn.Linear(d_model, dim_feedforward),
             nn.ReLU(),
             nn.Linear(dim_feedforward, d_model)
         )
@@ -52,7 +53,7 @@ class TransformerBlock(nn.Module):
         return x
 class EvoDecoder(nn.Module):
-    def __init__(self, vocab_size, d_model=256, nhead=4, num_layers=3, dim_feedforward=1024):
         super().__init__()
         self.token_emb = nn.Embedding(vocab_size, d_model)
         self.pos_emb = nn.Embedding(512, d_model)

         self.net = nn.Sequential(
             nn.Linear(d_model, dim_feedforward),
             nn.ReLU(),
+            nn.Dropout(),  # ✅ Important: was present in the training model
             nn.Linear(dim_feedforward, d_model)
         )
         return x
 class EvoDecoder(nn.Module):
+    def __init__(self, vocab_size, d_model=256, nhead=4, num_layers=3, dim_feedforward=512):
         super().__init__()
         self.token_emb = nn.Embedding(vocab_size, d_model)
         self.pos_emb = nn.Embedding(512, d_model)