BIOTECH-CHATBOT

Sleeping

C2MV commited on Jun 15

Commit

27975c5

verified ·

1 Parent(s): 18b5350

Update models.py

Files changed (1) hide show

models.py CHANGED Viewed

@@ -7,18 +7,23 @@ from config import EMBEDDING_MODEL_NAME
 # Cargar el modelo de embeddings
 def load_embedding_model():
-    # CORRECTO: Se determina el dispositivo y se convierte a un objeto torch.device.
     device_str = 'cuda' if torch.cuda.is_available() else 'cpu'
     device = torch.device(device_str)
-    # Se pasa el objeto device, no la cadena de texto. Esto soluciona el error.
-    embedding_model = SentenceTransformer(EMBEDDING_MODEL_NAME, device=device)
     print(f"Embedding model loaded on device: {embedding_model.device}")
     return embedding_model
-# Cargar el modelo Yi-Coder
 def load_yi_coder_model():
-    # CORRECTO: Se determina el dispositivo y se convierte a un objeto torch.device.
     device_str = 'cuda' if torch.cuda.is_available() else 'cpu'
     device = torch.device(device_str)
@@ -26,13 +31,13 @@ def load_yi_coder_model():
     tokenizer = AutoTokenizer.from_pretrained(model_path)
-    # El modelo se carga y luego se envía al dispositivo correcto usando .to(device).
     yi_coder_model = AutoModelForCausalLM.from_pretrained(
         model_path,
         torch_dtype=torch.float16,
-        low_cpu_mem_usage=True
     ).to(device).eval()
     print(f"Yi-Coder model loaded on device: {yi_coder_model.device}")
-    # Se devuelve el objeto device para ser usado en otras partes de la app.
     return tokenizer, yi_coder_model, device

 # Cargar el modelo de embeddings
 def load_embedding_model():
+    # Se determina el dispositivo y se convierte a un objeto torch.device.
     device_str = 'cuda' if torch.cuda.is_available() else 'cpu'
     device = torch.device(device_str)
+    # LA CORRECCIÓN: Añadir el parámetro 'use_safetensors=True'
+    # Esto fuerza a la librería a cargar 'model.safetensors' en lugar de 'pytorch_model.bin'.
+    embedding_model = SentenceTransformer(
+        EMBEDDING_MODEL_NAME,
+        device=device,
+        use_safetensors=True
+    )
     print(f"Embedding model loaded on device: {embedding_model.device}")
     return embedding_model
+# Cargar el modelo Yi-Coder (esta función ya estaba bien)
 def load_yi_coder_model():
     device_str = 'cuda' if torch.cuda.is_available() else 'cpu'
     device = torch.device(device_str)
     tokenizer = AutoTokenizer.from_pretrained(model_path)
     yi_coder_model = AutoModelForCausalLM.from_pretrained(
         model_path,
         torch_dtype=torch.float16,
+        low_cpu_mem_usage=True,
+        # También es buena práctica añadirlo aquí, aunque no era la causa del error.
+        use_safetensors=True
     ).to(device).eval()
     print(f"Yi-Coder model loaded on device: {yi_coder_model.device}")
     return tokenizer, yi_coder_model, device