Spaces:

aldohenrique
/

portalprogramando

Running

App Files Files Community

aldohenrique commited on Jun 10

Commit

67a5668

verified ·

1 Parent(s): 8823c04

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -160

app.py CHANGED Viewed

@@ -1,172 +1,54 @@
 import gradio as gr
-from transformers import pipeline
-import os
-# Modelos leves recomendados
 MODEL_OPTIONS = {
-    "Qwen2.5:3B": "Qwen/Qwen2.5-3B-Instruct",
-    "GPT-2 Médio": "gpt2-medium",
-    "BLOOM (560M)": "bigscience/bloom-560m",
-    "DistilGPT2": "distilgpt2",
     "TinyLLaMA": "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
 }
-# Escolha o modelo Qwen2.5
-MODEL_NAME = MODEL_OPTIONS["TinyLLaMA"]
-def load_model():
-    global MODEL_NAME  # Declarar global no início da função
-    # Tentar carregar com configurações otimizadas primeiro
-    try:
-        print(f"Tentando carregar modelo: {MODEL_NAME}")
-        return pipeline(
-            "text-generation",
-            model=MODEL_NAME,
-            max_new_tokens=512,
-            temperature=0.7,
-            top_p=0.9,
-            do_sample=True,
-            token=os.getenv("HF_TOKEN")
-        )
-    except Exception as e:
-        print(f"Erro com {MODEL_NAME}: {str(e)}")
-        # Fallback 1: Tentar modelo menor
-        print("Tentando modelo Qwen2.5:0.5B...")
-        try:
-            MODEL_NAME = MODEL_OPTIONS["Qwen2.5:0.5B"]
-            return pipeline(
-                "text-generation",
-                model=MODEL_NAME,
-                max_new_tokens=512,
-                temperature=0.7,
-                top_p=0.9,
-                do_sample=True,
-                token=os.getenv("HF_TOKEN")
-            )
-        except Exception as e2:
-            print(f"Erro com Qwen2.5:0.5B: {str(e2)}")
-            # Fallback 2: GPT-2 Medium (mais compatível)
-            print("Tentando GPT-2 Medium...")
-            try:
-                MODEL_NAME = MODEL_OPTIONS["GPT-2 Médio"]
-                return pipeline(
-                    "text-generation",
-                    model=MODEL_NAME,
-                    max_new_tokens=256,
-                    temperature=0.7,
-                    top_p=0.9,
-                    do_sample=True
-                )
-            except Exception as e3:
-                print(f"Erro com GPT-2: {str(e3)}")
-                # Fallback 3: BLOOM (último recurso)
-                print("Tentando BLOOM...")
-                try:
-                    MODEL_NAME = MODEL_OPTIONS["BLOOM (560M)"]
-                    return pipeline(
-                        "text-generation",
-                        model=MODEL_NAME,
-                        max_new_tokens=256,
-                        temperature=0.7,
-                        top_p=0.9,
-                        do_sample=True
-                    )
-                except Exception as e4:
-                    raise gr.Error(f"Falha ao carregar qualquer modelo. Último erro: {str(e4)}")
-gerador = load_model()
 def responder_como_aldo(pergunta):
-    # Adaptar prompt baseado no modelo carregado
-    if "Qwen" in MODEL_NAME:
-        # Prompt otimizado para Qwen2.5
-        prompt = f"""<|im_start|>system
-Você é o professor Dr. Aldo Henrique, especialista em programação C, Java, desenvolvimento web e inteligência artificial. Responda com clareza, profundidade e tom acadêmico, como um professor experiente e didático.
-<|im_end|>
-<|im_start|>user
-{pergunta}
-<|im_end|>
-<|im_start|>assistant"""
-    else:
-        # Prompt genérico para outros modelos
-        prompt = f"""Você é o professor Dr. Aldo Henrique, especialista em programação C, Java, desenvolvimento web e inteligência artificial. Responda com clareza, profundidade e tom acadêmico.
 Pergunta: {pergunta}
 Resposta:"""
     try:
-        # Configurar parâmetros baseados no modelo
-        max_tokens = 300 if "Qwen" in MODEL_NAME else 200
-        resposta = gerador(
-            prompt,
-            max_new_tokens=max_tokens,
-            pad_token_id=gerador.tokenizer.eos_token_id,
-            eos_token_id=gerador.tokenizer.eos_token_id,
-            truncation=True
-        )[0]["generated_text"]
-        # Extrair apenas a resposta do assistente
-        if "Qwen" in MODEL_NAME and "<|im_start|>assistant" in resposta:
-            resposta_limpa = resposta.split("<|im_start|>assistant")[-1]
-            resposta_limpa = resposta_limpa.split("<|im_end|>")[0] if "<|im_end|>" in resposta_limpa else resposta_limpa
-            return resposta_limpa.strip()
-        elif "Resposta:" in resposta:
-            resposta_limpa = resposta.split("Resposta:")[-1]
-            return resposta_limpa.strip()
-        else:
-            # Fallback: pegar texto após o prompt
-            resposta_limpa = resposta.replace(prompt, "").strip()
-            return resposta_limpa if resposta_limpa else "Desculpe, não consegui gerar uma resposta adequada."
     except Exception as e:
-        return f"Erro ao gerar resposta: {str(e)}. Tente reformular sua pergunta."
-# Interface melhorada
-with gr.Blocks(
-    title="Pergunte ao Dr. Aldo Henrique",
-    theme=gr.themes.Soft(),
-    css="""
-    .gradio-container {
-        max-width: 800px;
-        margin: auto;
-    }
-    """
-) as interface:
-    gr.Markdown("# 🎓 Pergunte ao Dr. Aldo Henrique")
-    gr.Markdown(f"**Modelo atual:** {MODEL_NAME}")
-    gr.Markdown("💻 Especialista em C, Java, desenvolvimento web e IA. Tire suas dúvidas com clareza e profundidade acadêmica.")
-    with gr.Row():
-        with gr.Column(scale=1):
-            entrada = gr.Textbox(
-                lines=6,
-                label="📝 Sua pergunta",
-                placeholder="Digite sua dúvida sobre programação, desenvolvimento web ou IA...",
-                info="Seja específico para obter respostas mais precisas"
-            )
-            btn = gr.Button("🚀 Enviar Pergunta", variant="primary", size="lg")
-        with gr.Column(scale=1):
-            saida = gr.Textbox(
-                label="💡 Resposta do Dr. Aldo",
-                interactive=False,
-                lines=10
-            )
-    # Exemplos de perguntas
-    gr.Examples(
         examples=[
             ["Como implementar uma lista ligada em C?"],
             ["Qual a diferença entre == e equals() em Java?"],
@@ -176,17 +58,13 @@ with gr.Blocks(
         ],
         inputs=entrada
     )
-    btn.click(responder_como_aldo, inputs=entrada, outputs=saida)
-    gr.Markdown("---")
-    gr.Markdown("*Desenvolvido com Qwen2.5 - Modelo de linguagem otimizado para educação*")
-# Configurações de lançamento otimizadas
 if __name__ == "__main__":
     interface.launch(
         server_name="0.0.0.0",
         server_port=7860,
-        share=True,
-        show_error=True
     )

 import gradio as gr
+from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
+import torch
+# === Modelos leves recomendados ===
 MODEL_OPTIONS = {
+    "DistilGPT2": "distilgpt2",  # muito rápido e leve (~80MB)
     "TinyLLaMA": "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
 }
+# === Escolha o modelo padrão mais leve ===
+MODEL_NAME = MODEL_OPTIONS["DistilGPT2"]
+# === Carrega modelo e tokenizer uma vez ===
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
+gerador = pipeline(
+    "text-generation",
+    model=model,
+    tokenizer=tokenizer,
+    device=0 if torch.cuda.is_available() else -1,
+    max_new_tokens=200,
+    temperature=0.7,
+    top_p=0.9,
+    do_sample=True
+)
+# === Função principal ===
 def responder_como_aldo(pergunta):
+    prompt = f"""Você é o professor Dr. Aldo Henrique, especialista em C, Java, Web e IA. Responda de forma clara, acadêmica e precisa.
 Pergunta: {pergunta}
 Resposta:"""
     try:
+        resposta = gerador(prompt, max_new_tokens=200)[0]["generated_text"]
+        resposta_limpa = resposta.replace(prompt, "").strip()
+        return resposta_limpa if resposta_limpa else "Desculpe, não consegui gerar uma resposta adequada."
     except Exception as e:
+        return f"Erro: {str(e)}"
+# === Interface Gradio ===
+with gr.Blocks(title="Pergunte ao Dr. Aldo Henrique") as interface:
+    gr.Markdown("## 🤖 Pergunte ao Dr. Aldo Henrique")
+    gr.Markdown(f"**Modelo carregado:** `{MODEL_NAME}`")
+    entrada = gr.Textbox(label="Pergunta", placeholder="Ex: Como usar ponteiros em C?", lines=4)
+    saida = gr.Textbox(label="Resposta do Dr. Aldo", lines=8, interactive=False)
+    botao = gr.Button("Responder")
+    exemplos = gr.Examples(
         examples=[
             ["Como implementar uma lista ligada em C?"],
             ["Qual a diferença entre == e equals() em Java?"],
         ],
         inputs=entrada
     )
+    botao.click(fn=responder_como_aldo, inputs=entrada, outputs=saida)
+# === Lançamento com configurações otimizadas para HuggingFace ===
 if __name__ == "__main__":
     interface.launch(
         server_name="0.0.0.0",
         server_port=7860,
+        share=False
     )