Spaces:

HemanM
/

EvoPlatform

Sleeping

HemanM commited on Jul 24

Commit

785c4f7

verified ·

1 Parent(s): 09f0cd3

Update inference.py

Files changed (1) hide show

inference.py CHANGED Viewed

+import torch
+from evo_model import EvoTransformer
+# Load EvoTransformer model
+def load_model(model_path="evo_hellaswag.pt", device=None):
+    if device is None:
+        device = "cuda" if torch.cuda.is_available() else "cpu"
+    model = EvoTransformer()
+    model.load_state_dict(torch.load(model_path, map_location=device))
+    model.to(device)
+    model.eval()
+    return model, device
+# Predict the best option (0 or 1)
+def predict(model, tokenizer, prompt, option1, option2, device):
+    inputs = [
+        f"{prompt} {option1}",
+        f"{prompt} {option2}",
+    ]
+    encoded = tokenizer(inputs, padding=True, truncation=True, return_tensors="pt").to(device)
+    with torch.no_grad():
+        outputs = model(encoded["input_ids"])
+    # Simple linear classifier logic
+    logits = torch.nn.functional.linear(outputs, model.classifier.weight, model.classifier.bias)
+    probs = torch.softmax(logits, dim=1)
+    best = torch.argmax(probs).item()
+    return {
+        "choice": best,
+        "confidence": probs[0][best].item(),
+        "scores": probs[0].tolist(),
+    }