joackoEsp commited on
Commit
14cd230
verified
1 Parent(s): a9b1392

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +10 -8
app.py CHANGED
@@ -7,25 +7,27 @@ model_name = "BSC-LT/salamandra-2b"
7
  tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
8
  model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)
9
 
10
- # Funci贸n de generaci贸n optimizada
11
  def generate_response(prompt):
12
- inputs = tokenizer(prompt, return_tensors="pt")
13
 
 
 
14
  outputs = model.generate(
15
  inputs.input_ids,
16
- max_length=60, # 馃敼 Antes: 100 | Ahora: 60 (reduce tiempo sin cortar demasiado)
17
  do_sample=True,
18
- temperature=0.65, # 馃敼 Antes: 0.7 | Ahora: 0.65 (ligera reducci贸n de aleatoriedad)
19
- top_p=0.9, # 馃敼 Nuevo: Prioriza palabras m谩s probables para mayor fluidez
20
- repetition_penalty=1.2, # 馃敼 Nuevo: Evita respuestas repetitivas
21
- early_stopping=True, # 馃敼 Nuevo: Reduce tiempos innecesarios
22
  )
23
 
24
  return tokenizer.decode(outputs[0], skip_special_tokens=True)
25
 
26
  # Interfaz en Gradio
27
  with gr.Blocks() as demo:
28
- gr.Markdown("# 馃 Chatbot ALIA - Optimizado")
29
  input_text = gr.Textbox(label="Escribe tu texto aqu铆")
30
  output_text = gr.Textbox(label="Respuesta de ALIA")
31
  submit_button = gr.Button("Generar respuesta")
 
7
  tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
8
  model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)
9
 
10
+ # Funci贸n de generaci贸n optimizada con System Prompt
11
  def generate_response(prompt):
12
+ system_prompt = "Responde solo con el texto solicitado, sin informaci贸n personal ni datos irrelevantes."
13
 
14
+ inputs = tokenizer(f"Instrucci贸n: {system_prompt} \n Usuario: {prompt} \n Respuesta:", return_tensors="pt")
15
+
16
  outputs = model.generate(
17
  inputs.input_ids,
18
+ max_length=50, # 馃敼 Antes: 60 | Ahora: 50 (reduce tiempo sin cortar demasiado)
19
  do_sample=True,
20
+ temperature=0.5, # 馃敼 Antes: 0.65 | Ahora: 0.5 (menos aleatoriedad, m谩s precisi贸n)
21
+ top_p=0.85, # 馃敼 Antes: 0.9 | Ahora: 0.85 (m谩s controlado)
22
+ repetition_penalty=1.2, # 馃敼 Evita respuestas repetitivas
23
+ early_stopping=True, # 馃敼 Detiene la respuesta si ya est谩 completa
24
  )
25
 
26
  return tokenizer.decode(outputs[0], skip_special_tokens=True)
27
 
28
  # Interfaz en Gradio
29
  with gr.Blocks() as demo:
30
+ gr.Markdown("# 馃 Chatbot SOLID&ALIA - Optimizado con Instrucciones Claras")
31
  input_text = gr.Textbox(label="Escribe tu texto aqu铆")
32
  output_text = gr.Textbox(label="Respuesta de ALIA")
33
  submit_button = gr.Button("Generar respuesta")