Spaces:

DHEIVER
/

rag_trescal

Sleeping

App Files Files Community

DHEIVER commited on Jun 9

Commit

e0164c8

verified ·

1 Parent(s): b4469af

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -10

app.py CHANGED Viewed

@@ -72,19 +72,23 @@ def answer_question(question, knowledge_state):
     # Etapa de Recuperação (sem alterações)
     question_embedding = retriever_model.encode(question, convert_to_tensor=True)
     cosine_scores = util.cos_sim(question_embedding, knowledge_base_embeddings)
-    top_k = min(3, len(knowledge_base))
     top_results = torch.topk(cosine_scores, k=top_k, dim=-1)
     retrieved_context = "\n---\n".join([knowledge_base[i] for i in top_results.indices[0]])
     print(f"\n--- Nova Pergunta de Auditoria ---")
     print(f"Pergunta: {question}")
     print(f"Contexto Recuperado (Top {top_k}):\n{retrieved_context}")
-    # MUDANÇA: Prompt ajustado para o formato de instrução do DeepSeek
     prompt = f"""### Instruction:
-Você é um assistente de IA. Responda à pergunta do usuário ou execute a tarefa solicitada com base nos trechos de documentos fornecidos. Se a pergunta for aberta, como "explique o documento", resuma os pontos principais encontrados nos trechos.
-**Documentos:**
 {retrieved_context}
 **Pergunta:**
@@ -96,17 +100,16 @@ Você é um assistente de IA. Responda à pergunta do usuário ou execute a tare
     input_ids = generator_tokenizer(prompt, return_tensors="pt").input_ids
     input_length = input_ids.shape[1]
-    # MUDANÇA: Ajuste nos parâmetros de geração
     outputs = generator_model.generate(
         input_ids,
-        max_new_tokens=256,  # Controla o tamanho da *nova* resposta gerada
-        do_sample=False,     # Desativa a amostragem para respostas mais diretas
         eos_token_id=generator_tokenizer.eos_token_id,
-        pad_token_id=generator_tokenizer.eos_token_id # Evita warnings
     )
-    # MUDANÇA: Decodificação correta para modelos Causal LM
-    # Precisamos remover o prompt inicial da saída gerada.
     generated_tokens = outputs[0, input_length:]
     answer = generator_tokenizer.decode(generated_tokens, skip_special_tokens=True)

     # Etapa de Recuperação (sem alterações)
     question_embedding = retriever_model.encode(question, convert_to_tensor=True)
     cosine_scores = util.cos_sim(question_embedding, knowledge_base_embeddings)
+    top_k = min(5, len(knowledge_base)) # Aumentado para 5 para mais contexto
     top_results = torch.topk(cosine_scores, k=top_k, dim=-1)
     retrieved_context = "\n---\n".join([knowledge_base[i] for i in top_results.indices[0]])
+    # Verificação para garantir que o contexto não está vazio
+    if not retrieved_context.strip():
+        return "Não foi possível encontrar um contexto relevante nos documentos para responder a esta pergunta."
     print(f"\n--- Nova Pergunta de Auditoria ---")
     print(f"Pergunta: {question}")
     print(f"Contexto Recuperado (Top {top_k}):\n{retrieved_context}")
+    # MUDANÇA PRINCIPAL: Prompt muito mais direto para forçar o uso do contexto
     prompt = f"""### Instruction:
+Use estritamente a informação fornecida no 'Contexto' para responder à 'Pergunta'. Não adicione informações externas. Se a pergunta for sobre explicar o documento, resuma os pontos principais do contexto.
+**Contexto:**
 {retrieved_context}
 **Pergunta:**
     input_ids = generator_tokenizer(prompt, return_tensors="pt").input_ids
     input_length = input_ids.shape[1]
+    # Ajuste nos parâmetros de geração
     outputs = generator_model.generate(
         input_ids,
+        max_new_tokens=300,  # Aumentado para permitir resumos mais longos
+        do_sample=False,
         eos_token_id=generator_tokenizer.eos_token_id,
+        pad_token_id=generator_tokenizer.eos_token_id
     )
+    # Decodificação correta para modelos Causal LM
     generated_tokens = outputs[0, input_length:]
     answer = generator_tokenizer.decode(generated_tokens, skip_special_tokens=True)