Spaces:

Estherrr777
/

Mila-Wellnest-Backend

Runtime error

App Files Files Community

Mila-Wellnest-Backend / backend /app /model.py

Estherrr777

Update backend/app/model.py

7e76660 verified about 2 months ago

raw

history blame contribute delete

2.66 kB

	import torch
	from transformers import AutoTokenizer, AutoModelForSequenceClassification
	import os

	MODEL_NAME = "distilbert-base-uncased"
	SAVE_PATH = "./data/best_model"
	LABEL_MAP = {0: "low risk", 1: "medium risk", 2: "high risk"}

	# Load tokenizer from saved fine-tuned model if available
	tokenizer = AutoTokenizer.from_pretrained(SAVE_PATH if os.path.isdir(SAVE_PATH) else MODEL_NAME)

	_model = None # ← this stores the model in memory

	def load_model():
	global _model
	if _model is not None:
	return _model # ✅ already loaded

	model_path = os.path.join(SAVE_PATH, "pytorch_model.bin")
	if os.path.exists(model_path):
	print("✅ Loading fine-tuned model...")
	_model = AutoModelForSequenceClassification.from_pretrained(SAVE_PATH)
	else:
	print("⚠️ Fine-tuned model not found. Falling back to base model:", MODEL_NAME)
	_model = AutoModelForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=3)

	_model.eval()
	return _model

	def predict(input_data: str):
	model = load_model()
	with torch.no_grad():
	inputs = tokenizer(input_data, return_tensors="pt", truncation=True, padding=True, max_length=256)
	outputs = model(**inputs)
	predicted_class = torch.argmax(outputs.logits, dim=1).item()
	return LABEL_MAP.get(predicted_class, "unknown")



	# import torch
	# from transformers import AutoTokenizer, AutoModelForSequenceClassification
	# import os

	# MODEL_NAME = "google/gemma-1.1-2b-it"
	# SAVE_PATH = "./data/best_model"
	# LABEL_MAP = {0: "low risk", 1: "medium risk", 2: "high risk"}

	# # Load tokenizer from saved model if available
	# if os.path.exists(SAVE_PATH):
	# tokenizer = AutoTokenizer.from_pretrained(SAVE_PATH)
	# else:
	# tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)

	# def load_model():
	# model_path = os.path.join(SAVE_PATH, "best_model")
	# if os.path.exists(model_path):
	# print("✅ Loading fine-tuned model from:", model_path)
	# model = AutoModelForSequenceClassification.from_pretrained(model_path)
	# else:
	# print("🔁 Loading base model (not yet fine-tuned):", MODEL_NAME)
	# model = AutoModelForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=3)
	# return model

	# def predict(input_data: str):
	# model = load_model()
	# model.eval()
	# with torch.no_grad():
	# inputs = tokenizer(input_data, return_tensors="pt", truncation=True, padding=True, max_length=256)
	# outputs = model(**inputs)
	# predicted_class = torch.argmax(outputs.logits, dim=1).item()
	# return LABEL_MAP.get(predicted_class, "unknown")