Spaces:

joackoEsp
/

Solid-ALIA

Paused

File size: 2,598 Bytes

6c036c1
aab52b9
 
 
b08158b
a9b1392
aab52b9
b08158b
61e43c4
 
 
b08158b
ede8245
 
 
 
19693ec
4025a2e
b08158b
5ef6d7c
ede8245
9894719
953176b
 
 
 
5ef6d7c
e3d3bd5
b08158b
 
 
 
19693ec
 
b08158b
ede8245
f60a1b9
ede8245
 
b08158b
953176b
b1f7af6
19693ec
 
aab52b9
 
19693ec
aab52b9
4025a2e
b08158b
 
 
 
aab52b9

import gradio as gr
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Cargar el modelo y el tokenizador solo una vez para evitar recargas
model_name = "BSC-LT/salamandra-2b"

if "tokenizer" not in globals():
    tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
    tokenizer.pad_token = tokenizer.eos_token  # 🔹 Evita errores de atención

if "model" not in globals():
    model = AutoModelForCausalLM.from_pretrained(
        model_name, torch_dtype=torch.float16, device_map="auto"  # 🔹 Optimiza la inferencia según los recursos
    )
    model.eval()  # 🔹 Reduce el consumo innecesario de memoria

# Función exclusiva para humanización de texto con enfoque en marketing
def humanize_text(input_text):
    system_prompt = (
        "Reescribe el siguiente texto con un estilo más natural, accesible y persuasivo, "
        "manteniendo su significado original. "
        "Adopta un tono más claro y cercano, ideal para comunicación en marketing. "
        "Convierte estructuras rígidas en frases más dinámicas y fluidas, "
        "pero sin perder profesionalismo ni omitir información importante. "
        "El resultado debe sentirse humano y auténtico."
    )

    prompt = f"{system_prompt}\n\nTexto original: {input_text}\n\nTexto humanizado:"
    
    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True)

    outputs = model.generate(
        inputs.input_ids,
        attention_mask=inputs.attention_mask,
        max_new_tokens=140,  # 🔹 Limita la cantidad de palabras generadas para mejorar la velocidad
        min_length=30,  # 🔹 Evita respuestas demasiado cortas
        do_sample=False,  # 🔹 Genera una respuesta más rápida y directa
        temperature=0.75,  # 🔹 Mantiene equilibrio entre fluidez y velocidad
        top_p=0.9,  # 🔹 Mantiene coherencia en la reescritura
        repetition_penalty=1.05,  # 🔹 Evita repeticiones sin restringir demasiado
        num_return_sequences=1,  # 🔹 Genera solo una respuesta bien formulada
    )

    return tokenizer.decode(outputs[0], skip_special_tokens=True)

# Interfaz en Gradio
with gr.Blocks() as demo:
    gr.Markdown("# ✍️ Humanización de Texto con ALIA (Optimizado para Marketing)")
    input_text = gr.Textbox(label="Pega aquí el texto generado por IA para humanizar")
    output_text = gr.Textbox(label="Texto humanizado por ALIA", interactive=False)
    submit_button = gr.Button("Humanizar Texto")
    submit_button.click(humanize_text, inputs=input_text, outputs=output_text)

demo.launch()