Spaces:

aldohenrique
/

portalprogramando

Running

App Files Files Community

aldohenrique commited on Jun 15

Commit

0173d74

verified ·

1 Parent(s): 243f645

Update ai_logic.py

Browse files

Files changed (1) hide show

ai_logic.py +53 -45

ai_logic.py CHANGED Viewed

@@ -20,13 +20,13 @@ if not HF_TOKEN:
 # Lista inicial de modelos
 MODELS = {
-    "Mistral 7B (Mais acertivo)": "mistralai/Mistral-7B-Instruct-v0.3",
-    "Phi-3 Mini (Mais rápido)": "microsoft/Phi-3-mini-4k-instruct",
-    "Zephyr 7B (Meio Termo)": "HuggingFaceH4/zephyr-7b-beta"
 }
 # Novos modelos para testar
 NEW_MODELS_TO_TEST = [
     ("LLaMA 2-7B Chat", "meta-llama/Llama-2-7b-chat-hf"),
     ("LLaMA 3.2-3B Instruct", "meta-llama/Llama-3.2-3B-Instruct"),
     ("Gemma 2B Instruct", "google/gemma-2b-it"),
@@ -64,7 +64,7 @@ def load_conversation_memory(session_id: str):
                 session_data = json.load(f)
         except Exception as e:
             print(f"Erro ao carregar memória para sessão '{session_id}': {e}")
     user_sessions[session_id] = session_data
 def save_conversation_memory(session_id: str):
@@ -107,7 +107,7 @@ def update_user_profile(session_id: str, user_message: str):
     for topic, keywords in topics.items():
         if any(keyword in message_lower for keyword in keywords):
             profile[f'interesse_{topic}'] = profile.get(f'interesse_{topic}', 0) + 1
     profile['total_perguntas'] = profile.get('total_perguntas', 0) + 1
     user_sessions[session_id]['user_profile'] = profile
@@ -180,7 +180,7 @@ def build_and_save_vector_store():
     texts = [scrape_text_from_url(link) for link in links if scrape_text_from_url(link)]
     if not texts:
         return "Nenhum conteúdo encontrado."
     text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=150)
     chunks = text_splitter.create_documents(texts)
     embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
@@ -261,7 +261,7 @@ class HuggingFaceAPIClient:
                     return True, "Modelo disponível para inferência"
                 else:
                     return False, f"Resposta inesperada: {result}"
             elif response.status_code == 503:
                 return False, "Modelo está carregando (503)"
             elif response.status_code == 400:
@@ -289,7 +289,7 @@ class HuggingFaceAPIClient:
         info_available, info_msg = self.check_model_info(model_name)
         if not info_available:
             return False, f"Info check failed: {info_msg}"
         print(f"  ✓ Info check: {info_msg}")
         # Em seguida testa a inferência
@@ -348,7 +348,7 @@ class HuggingFaceAPIClient:
                 prompt_parts.append(f"Usuário: {content}")
             elif role == 'assistant':
                 prompt_parts.append(f"Assistente: {content}")
         prompt_parts.append("Assistente:")
         return "\n\n".join(prompt_parts)
@@ -356,25 +356,30 @@ api_client = HuggingFaceAPIClient(HF_TOKEN)
 # --- Função para Testar e Atualizar Modelos ---
 def test_and_update_models() -> int:
-    """Testa a disponibilidade dos novos modelos e atualiza a lista MODELS. Retorna o número de modelos aceitos."""
     print("Testando disponibilidade dos novos modelos...")
     print(f"Token HF disponível: {'Sim' if HF_TOKEN else 'Não'}")
     print("-" * 60)
-    available_models = []
     unavailable_models = []
     for model_label, model_name in NEW_MODELS_TO_TEST:
         is_available, message = api_client.test_model_availability(model_name)
         if is_available:
-            MODELS[model_label] = model_name
-            available_models.append((model_label, model_name, message))
             print(f"✓ {model_label}")
         else:
             unavailable_models.append((model_label, model_name, message))
             print(f"✗ {model_label} - {message}")
         # Pequena pausa para evitar rate limiting
         time.sleep(1)
@@ -383,14 +388,14 @@ def test_and_update_models() -> int:
     print("RESULTADOS DA VALIDAÇÃO:")
     print("=" * 60)
-    if available_models:
-        print(f"\n✓ MODELOS DISPONÍVEIS ({len(available_models)}):")
-        for label, name, msg in available_models:
             print(f"  - {label}")
             print(f"    {name}")
             print(f"    Status: {msg}")
             print()
     if unavailable_models:
         print(f"\n✗ MODELOS NÃO DISPONÍVEIS ({len(unavailable_models)}):")
         for label, name, msg in unavailable_models:
@@ -398,14 +403,13 @@ def test_and_update_models() -> int:
             print(f"    {name}")
             print(f"    Motivo: {msg}")
             print()
-    print(f"TOTAL DE MODELOS DISPONÍVEIS: {len(MODELS)}")
     print("=" * 60)
     # Salva a lista atualizada de modelos
     save_updated_models()
-    return len(available_models)  # Retorna o número de novos modelos aceitos
 def save_updated_models():
     """Salva a lista atualizada de modelos em um arquivo."""
@@ -421,7 +425,7 @@ def responder_como_aldo(session_id: str, pergunta: str, modelo: str = DEFAULT_MO
     """Gera resposta como Dr. Aldo Henrique."""
     if not pergunta.strip():
         return "Por favor, faça uma pergunta válida."
     load_conversation_memory(session_id)
     update_user_profile(session_id, pergunta)
@@ -433,7 +437,7 @@ def responder_como_aldo(session_id: str, pergunta: str, modelo: str = DEFAULT_MO
         contexto.append(f"**Conversa Anterior**\n{conversa}")
     if blog := retrieve_context_from_blog(pergunta):
         contexto.append(f"**Contexto do Blog**\n{blog}")
     system_prompt = """Você é o Dr. Aldo Henrique,
         Doutor em Ciências da Computação pela UnB (2024), mestre em Ciências da Computação pela UnB (2017) e bacharel em Sistemas de Informação pela UFV (2014).
         Professor universitário, onde leciona disciplinas como Algoritmos, Inteligência Artificial, Ciência de Dados e Mineração de Dados.
@@ -463,29 +467,33 @@ def responder_como_aldo(session_id: str, pergunta: str, modelo: str = DEFAULT_MO
 # --- Inicialização ---
 def inicializar_sistema():
-    """Inicializa o sistema e só carrega a página se 3 ou mais modelos forem aceitos."""
     print("Inicializando Chatbot Dr. Aldo...")
-    # Testa os modelos e verifica quantos foram aceitos
-    num_models_accepted = test_and_update_models()
-    if num_models_accepted >= 3:
-        print(f"{num_models_accepted} modelos aceitos. Carregando a página...")
         load_vector_store()
-        print("Sistema inicializado!")
     else:
-        print(f"Apenas {num_models_accepted} modelos aceitos. O sistema não será carregado.")
-        raise SystemExit("Menos de 3 modelos disponíveis. Encerrando execução.")
-if __name__ == "__main__":
-    inicializar_sistema()
-    # Teste básico
-    session_id = "teste_123"
-    print("\n" + "="*50)
-    print("TESTE DO CHATBOT:")
-    print("="*50)
-    print(responder_como_aldo(session_id, "O que é Java?"))
-    print("\n" + "-"*50)
-    print(responder_como_aldo(session_id, "Mostre um exemplo de código Java."))
-    print("\n" + "-"*50)
-    print(clear_memory(session_id))

 # Lista inicial de modelos
 MODELS = {
 }
 # Novos modelos para testar
 NEW_MODELS_TO_TEST = [
+    ("Mistral 7B (Mais acertivo)", "mistralai/Mistral-7B-Instruct-v0.3"),
+    ("Phi-3 Mini (Mais rápido)", "microsoft/Phi-3-mini-4k-instruct"),
+    ("Zephyr 7B (Meio Termo)", "HuggingFaceH4/zephyr-7b-beta"),
     ("LLaMA 2-7B Chat", "meta-llama/Llama-2-7b-chat-hf"),
     ("LLaMA 3.2-3B Instruct", "meta-llama/Llama-3.2-3B-Instruct"),
     ("Gemma 2B Instruct", "google/gemma-2b-it"),
                 session_data = json.load(f)
         except Exception as e:
             print(f"Erro ao carregar memória para sessão '{session_id}': {e}")
     user_sessions[session_id] = session_data
 def save_conversation_memory(session_id: str):
     for topic, keywords in topics.items():
         if any(keyword in message_lower for keyword in keywords):
             profile[f'interesse_{topic}'] = profile.get(f'interesse_{topic}', 0) + 1
     profile['total_perguntas'] = profile.get('total_perguntas', 0) + 1
     user_sessions[session_id]['user_profile'] = profile
     texts = [scrape_text_from_url(link) for link in links if scrape_text_from_url(link)]
     if not texts:
         return "Nenhum conteúdo encontrado."
     text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=150)
     chunks = text_splitter.create_documents(texts)
     embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
                     return True, "Modelo disponível para inferência"
                 else:
                     return False, f"Resposta inesperada: {result}"
             elif response.status_code == 503:
                 return False, "Modelo está carregando (503)"
             elif response.status_code == 400:
         info_available, info_msg = self.check_model_info(model_name)
         if not info_available:
             return False, f"Info check failed: {info_msg}"
         print(f"  ✓ Info check: {info_msg}")
         # Em seguida testa a inferência
                 prompt_parts.append(f"Usuário: {content}")
             elif role == 'assistant':
                 prompt_parts.append(f"Assistente: {content}")
         prompt_parts.append("Assistente:")
         return "\n\n".join(prompt_parts)
 # --- Função para Testar e Atualizar Modelos ---
 def test_and_update_models() -> int:
+    """
+    Testa a disponibilidade dos novos modelos e atualiza a lista MODELS.
+    Retorna o número de modelos disponíveis (incluindo os iniciais).
+    """
     print("Testando disponibilidade dos novos modelos...")
     print(f"Token HF disponível: {'Sim' if HF_TOKEN else 'Não'}")
     print("-" * 60)
+    initial_model_count = len(MODELS) # Contar os modelos já existentes
+    available_models_during_test = []
     unavailable_models = []
     for model_label, model_name in NEW_MODELS_TO_TEST:
         is_available, message = api_client.test_model_availability(model_name)
         if is_available:
+            if model_label not in MODELS: # Adiciona apenas se não estiver já na lista inicial
+                MODELS[model_label] = model_name
+            available_models_during_test.append((model_label, model_name, message))
             print(f"✓ {model_label}")
         else:
             unavailable_models.append((model_label, model_name, message))
             print(f"✗ {model_label} - {message}")
         # Pequena pausa para evitar rate limiting
         time.sleep(1)
     print("RESULTADOS DA VALIDAÇÃO:")
     print("=" * 60)
+    if available_models_during_test:
+        print(f"\n✓ MODELOS DISPONÍVEIS (novos e testados: {len(available_models_during_test)}):")
+        for label, name, msg in available_models_during_test:
             print(f"  - {label}")
             print(f"    {name}")
             print(f"    Status: {msg}")
             print()
     if unavailable_models:
         print(f"\n✗ MODELOS NÃO DISPONÍVEIS ({len(unavailable_models)}):")
         for label, name, msg in unavailable_models:
             print(f"    {name}")
             print(f"    Motivo: {msg}")
             print()
+    print(f"TOTAL DE MODELOS ATUALMENTE DISPONÍVEIS: {len(MODELS)}")
     print("=" * 60)
     # Salva a lista atualizada de modelos
     save_updated_models()
+    return len(MODELS) # Retorna a contagem total de modelos disponíveis
 def save_updated_models():
     """Salva a lista atualizada de modelos em um arquivo."""
     """Gera resposta como Dr. Aldo Henrique."""
     if not pergunta.strip():
         return "Por favor, faça uma pergunta válida."
     load_conversation_memory(session_id)
     update_user_profile(session_id, pergunta)
         contexto.append(f"**Conversa Anterior**\n{conversa}")
     if blog := retrieve_context_from_blog(pergunta):
         contexto.append(f"**Contexto do Blog**\n{blog}")
     system_prompt = """Você é o Dr. Aldo Henrique,
         Doutor em Ciências da Computação pela UnB (2024), mestre em Ciências da Computação pela UnB (2017) e bacharel em Sistemas de Informação pela UFV (2014).
         Professor universitário, onde leciona disciplinas como Algoritmos, Inteligência Artificial, Ciência de Dados e Mineração de Dados.
 # --- Inicialização ---
 def inicializar_sistema():
+    """Inicializa o sistema, garantindo no mínimo 3 modelos disponíveis."""
     print("Inicializando Chatbot Dr. Aldo...")
+    num_available_models = test_and_update_models() # Retorna a contagem de modelos disponíveis
+    if num_available_models >= 3:
         load_vector_store()
+        print("Sistema inicializado e pronto para uso com modelos suficientes!")
+        return True # Indica que a inicialização foi bem-sucedida
+    else:
+        print(f"Erro: Apenas {num_available_models} modelos disponíveis. São necessários pelo menos 3 modelos para iniciar o sistema.")
+        return False # Indica que a inicialização falhou
+if __name__ == "__main__":  # Apenas este bloco é executado quando o script é chamado diretamente
+    if inicializar_sistema():
+        # Este é o local onde você colocaria o código para "carregar a página"
+        # Por exemplo, iniciar um framework web como Flask ou Streamlit.
+        # Por enquanto, vou manter seu teste básico como um placeholder para "carregar a página".
+        print("\n" + "="*50)
+        print("SISTEMA INICIADO: Realizando teste básico do Chatbot...")
+        print("="*50)
+        session_id = "teste_123"
+        print(responder_como_aldo(session_id, "O que é Java?"))
+        print("\n" + "-"*50)
+        print(responder_como_aldo(session_id, "Mostre um exemplo de código Java."))
+        print("\n" + "-"*50)
+        print(clear_memory(session_id))
     else:
+        print("\nSistema não pôde ser iniciado devido à falta de modelos suficientes.")
+        print("Por favor, verifique a conexão com o Hugging Face e o token de acesso.")