Spaces:

juanelot
/

Asistente_IA

Sleeping

juanelot commited on Sep 16, 2024

Commit

609cccb

verified ·

1 Parent(s): 2ac0298

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,25 +2,36 @@ import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 # Cargar el modelo y el tokenizador
-model_name = "microsoft/DialoGPT-medium"  # Puedes cambiar esto por otro modelo de chatbot
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
-def chatbot(input, history=[]):
     # Agregar el input del usuario al historial
-    history.append(input)
     # Tokenizar la conversación
-    input_ids = tokenizer.encode(" ".join(history), return_tensors="pt")
     # Generar una respuesta
-    output = model.generate(input_ids, max_length=1000, pad_token_id=tokenizer.eos_token_id)
     # Decodificar la respuesta
     response = tokenizer.decode(output[:, input_ids.shape[-1]:][0], skip_special_tokens=True)
     # Agregar la respuesta al historial
-    history.append(response)
     return history, history

 from transformers import AutoModelForCausalLM, AutoTokenizer
 # Cargar el modelo y el tokenizador
+model_name = "microsoft/DialoGPT-medium"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
+def chatbot(input, history):
+    # Asegúrate de que history sea una lista de listas
+    history = history or []
     # Agregar el input del usuario al historial
+    history.append([input, None])
+    # Preparar el contexto para el modelo
+    chat_history = []
+    for human, ai in history:
+        chat_history.append(human)
+        if ai:
+            chat_history.append(ai)
     # Tokenizar la conversación
+    input_ids = tokenizer.encode(" ".join(chat_history), return_tensors="pt")
     # Generar una respuesta
+    attention_mask = input_ids.new_ones(input_ids.shape)
+    output = model.generate(input_ids, attention_mask=attention_mask, max_length=1000, pad_token_id=tokenizer.eos_token_id)
     # Decodificar la respuesta
     response = tokenizer.decode(output[:, input_ids.shape[-1]:][0], skip_special_tokens=True)
     # Agregar la respuesta al historial
+    history[-1][1] = response
     return history, history