Spaces:

joackoEsp
/

Solid-ALIA

Paused

File size: 2,809 Bytes

6c036c1
aab52b9
 
 
b08158b
a9b1392
aab52b9
b08158b
61e43c4
 
 
b08158b
c50fc17
 
19693ec
c0a326a
b08158b
5ef6d7c
c0a326a
 
 
 
 
 
 
 
 
5ef6d7c
e3d3bd5
b08158b
 
 
 
19693ec
 
b08158b
c0a326a
 
 
 
b08158b
c0a326a
b1f7af6
19693ec
 
aab52b9
 
19693ec
aab52b9
c0a326a
b08158b
 
 
 
aab52b9

import gradio as gr
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Cargar el modelo y el tokenizador solo una vez para evitar recargas
model_name = "BSC-LT/salamandra-2b"

if "tokenizer" not in globals():
    tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
    tokenizer.pad_token = tokenizer.eos_token  # 🔹 Evita errores de atención

if "model" not in globals():
    model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)
    model.eval()  # 🔹 Optimiza la inferencia para que sea más rápida

# Función de humanización de texto con enfoque en contenido persuasivo
def humanize_text(input_text):
    system_prompt = (
        "Reescribe el siguiente texto de manera más natural, clara y persuasiva, "
        "haciéndolo más cercano y atractivo para el lector. Reformula las oraciones "
        "para que sean más dinámicas y menos rígidas, pero sin perder información clave. "
        "Evita frases genéricas y reemplázalas por expresiones más auténticas. "
        "Aquí tienes un ejemplo de cómo debería sonar la reescritura:\n\n"
        "Ejemplo:\n"
        "Texto original: 'Nuestro software es la mejor opción para cualquier empresa.'\n"
        "Texto humanizado: 'Si buscas una herramienta que realmente optimice tu negocio, nuestro software puede ser justo lo que necesitas.'\n\n"
        "Ahora reescribe el siguiente texto:"
    )

    prompt = f"{system_prompt}\n\nTexto original: {input_text}\n\nTexto humanizado:"
    
    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True)

    outputs = model.generate(
        inputs.input_ids,
        attention_mask=inputs.attention_mask,
        max_new_tokens=140,  # 🔹 Mantiene equilibrio entre reformulación y velocidad
        min_length=50,  # 🔹 Evita respuestas demasiado cortas
        do_sample=True,  # 🔹 Reactivamos la variabilidad para que reformule mejor
        temperature=0.78,  # 🔹 Ajustamos la creatividad sin perder precisión
        top_p=0.9,  # 🔹 Mantiene coherencia en la reescritura
        repetition_penalty=1.05,  # 🔹 Evita repeticiones sin restringir demasiado
        num_return_sequences=1,  # 🔹 Genera solo una respuesta bien formulada
    )

    return tokenizer.decode(outputs[0], skip_special_tokens=True)

# Interfaz en Gradio
with gr.Blocks() as demo:
    gr.Markdown("# ✍️ Humanización de Texto con ALIA (Corrección de Reescritura)")
    input_text = gr.Textbox(label="Pega aquí el texto generado por IA para humanizar")
    output_text = gr.Textbox(label="Texto humanizado por ALIA", interactive=False)
    submit_button = gr.Button("Humanizar Texto")
    submit_button.click(humanize_text, inputs=input_text, outputs=output_text)

demo.launch()