EvoPlatformV3

Sleeping

App Files Files Community

HemanM commited on Jul 25

Commit

5c94b85

verified ·

1 Parent(s): 2f93104

Create retrain_from_feedback

Browse files

Files changed (1) hide show

retrain_from_feedback +116 -0

retrain_from_feedback ADDED Viewed

	@@ -0,0 +1,116 @@

+# retrain_from_feedback.py
+import torch
+import torch.nn as nn
+import torch.optim as optim
+from torch.utils.data import DataLoader, Dataset
+from transformers import AutoTokenizer
+from evo_architecture import mutate_genome, default_config, log_genome
+from model import EvoTransformerV22  # Must accept dynamic config
+import csv
+import os
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+class FeedbackDataset(Dataset):
+    def __init__(self, tokenizer, data, max_len=128):
+        self.tokenizer = tokenizer
+        self.samples = data
+        self.max_len = max_len
+    def __len__(self):
+        return len(self.samples)
+    def __getitem__(self, idx):
+        q, o1, o2, ctx, ans, label = self.samples[idx]
+        text = f"{q} [SEP] {o1} [SEP] {o2} [SEP] {ctx}"
+        enc = self.tokenizer(text, padding="max_length", truncation=True, max_length=self.max_len, return_tensors="pt")
+        input_ids = enc["input_ids"].squeeze(0)
+        label = 1 if ans.strip().lower() == o1.strip().lower() else 0
+        return input_ids, torch.tensor(label)
+def load_feedback():
+    data = []
+    if not os.path.exists("feedback_log.csv"):
+        return data
+    with open("feedback_log.csv", encoding="utf-8") as f:
+        reader = csv.DictReader(f)
+        for row in reader:
+            if row["evo_was_correct"].strip().lower() == "yes":
+                data.append([
+                    row["question"],
+                    row["option1"],
+                    row["option2"],
+                    row["context"],
+                    row["evo_output"],
+                    "yes"
+                ])
+    return data
+def build_model(config):
+    from model import EvoEncoder
+    class CustomEvo(nn.Module):
+        def __init__(self):
+            super().__init__()
+            self.encoder = EvoEncoder(
+                d_model=512,
+                num_heads=config["num_heads"],
+                ffn_dim=config["ffn_dim"],
+                num_layers=config["num_layers"],
+                memory_enabled=config["memory_enabled"]
+            )
+            self.pool = nn.AdaptiveAvgPool1d(1)
+            self.classifier = nn.Linear(512, 1)
+        def forward(self, input_ids):
+            x = self.encoder(input_ids)
+            x = self.pool(x.transpose(1, 2)).squeeze(-1)
+            return self.classifier(x)
+    return CustomEvo().to(device)
+def train_evo():
+    tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
+    data = load_feedback()
+    if not data:
+        print("❌ No feedback data found.")
+        return
+    base_config = default_config()
+    new_config = mutate_genome(base_config)
+    model = build_model(new_config)
+    model.train()
+    dataset = FeedbackDataset(tokenizer, data)
+    loader = DataLoader(dataset, batch_size=4, shuffle=True)
+    loss_fn = nn.BCEWithLogitsLoss()
+    optimizer = optim.Adam(model.parameters(), lr=1e-4)
+    for epoch in range(3):
+        total_loss, correct = 0, 0
+        for input_ids, labels in loader:
+            input_ids, labels = input_ids.to(device), labels.float().to(device)
+            logits = model(input_ids).squeeze(-1)
+            loss = loss_fn(logits, labels)
+            optimizer.zero_grad()
+            loss.backward()
+            optimizer.step()
+            total_loss += loss.item()
+            preds = (torch.sigmoid(logits) > 0.5).long()
+            correct += (preds == labels.long()).sum().item()
+        acc = correct / len(dataset)
+        print(f"✅ Epoch {epoch+1} | Loss={total_loss:.4f} | Acc={acc:.4f}")
+    # Save model + genome
+    os.makedirs("trained_model", exist_ok=True)
+    torch.save(model.state_dict(), "trained_model/evo_retrained.pt")
+    log_genome(new_config, acc)
+    print("✅ Model saved and genome logged.")
+if __name__ == "__main__":
+    train_evo()