Spaces:

DHEIVER
/

rag_trescal

Sleeping

App Files Files Community

DHEIVER commited on Jun 9

Commit

74abfdf

verified ·

1 Parent(s): bee53f3

Update app.py

Browse files

Files changed (1) hide show

app.py +51 -44

app.py CHANGED Viewed

@@ -72,35 +72,33 @@ def process_files(files):
 # --- 3. O CÉREBRO DA ANÁLISE: generate_compliance_report ---
-def generate_compliance_report(task, knowledge_state, progress=gr.Progress(track_tqdm=True)):
     """
-    Esta função orquestra todo o processo de RAG: recupera um contexto amplo e usa um único
-    'super-prompt' para gerar o relatório de conformidade completo de uma só vez.
     """
-    if not task:
-        return "Por favor, forneça uma tarefa de análise."
-    if not knowledge_state or not knowledge_state[0] or knowledge_state[1] is None:
-        return "⚠️ A base de conhecimento está vazia. Por favor, processe alguns ficheiros primeiro."
-    knowledge_base, knowledge_base_embeddings = knowledge_state
-    progress(0, desc="A recuperar contexto relevante...")
-    # Passo 1: Recuperação Ampla do Contexto
-    # Usamos uma pergunta genérica para recuperar os chunks mais relevantes do documento inteiro.
-    # Aumentamos o top_k para dar ao modelo uma visão mais completa.
-    search_query = "Informações completas do certificado de calibração"
-    question_embedding = retriever_model.encode(search_query, convert_to_tensor=True)
-    cosine_scores = util.cos_sim(question_embedding, knowledge_base_embeddings)
-    top_k = min(15, len(knowledge_base)) # Aumentado para 15 para um contexto muito mais rico
-    top_results = torch.topk(cosine_scores, k=top_k, dim=-1)
-    retrieved_context = "\n\n---\n\n".join([knowledge_base[i] for i in top_results.indices[0]])
-    progress(0.5, desc="A gerar o relatório de conformidade...")
-    # Passo 2: Geração com "Super-Prompt"
-    # Este prompt contém a checklist completa e instrui o modelo a preenchê-la.
-    final_prompt = f"""### Instruction:
 Você é um auditor de metrologia a preencher um relatório de conformidade. Com base no 'Contexto do Documento' fornecido, preencha cada item da 'Checklist de Análise' abaixo. Se uma informação não for encontrada no contexto, escreva 'Não encontrado'.
 **Contexto do Documento:**
@@ -143,22 +141,30 @@ Você é um auditor de metrologia a preencher um relatório de conformidade. Com
 ### Response:
 """
-    input_ids = generator_tokenizer(final_prompt, return_tensors="pt").input_ids
-    outputs = generator_model.generate(
-        input_ids,
-        max_new_tokens=1024, # Aumentado para relatórios detalhados
-        do_sample=False,
-        pad_token_id=generator_tokenizer.eos_token_id
-    )
-    final_report = generator_tokenizer.decode(outputs[0], skip_special_tokens=True)
-    # Limpa a resposta para remover o prompt inicial
-    if "### Response:" in final_report:
-        final_report = final_report.split("### Response:")[1].strip()
-    progress(1, desc="Análise concluída.")
-    return final_report
 # --- 4. Interface Gráfica (Simplificada para o novo fluxo) ---
@@ -166,7 +172,7 @@ with gr.Blocks(theme=gr.themes.Soft()) as interface:
     knowledge_state = gr.State()
     gr.Markdown(
         """
-        # 🤖 Agente de Análise de Conformidade Metrológica (v12 - Robusto)
         **1. Carregue um documento**: Envie um certificado de calibração (`.pdf` ou `.txt`).
         **2. Processe o documento**: Clique no botão para criar a base de conhecimento.
         **3. Inicie a Análise**: Dê uma tarefa ao agente (ex: "Analisar conformidade deste certificado") e clique em "Iniciar Análise".
@@ -184,11 +190,12 @@ with gr.Blocks(theme=gr.themes.Soft()) as interface:
             submit_button = gr.Button("Iniciar Análise", variant="primary")
     with gr.Row():
-        report_box = gr.Textbox(label="Relatório Final de Análise", lines=20, max_lines=50)
     process_button.click(fn=process_files, inputs=[file_uploader], outputs=[knowledge_state, status_box])
     submit_button.click(fn=generate_compliance_report, inputs=[task_box, knowledge_state], outputs=[report_box])
 # --- 5. Lançamento do App ---
 if __name__ == "__main__":
-    interface.launch()

 # --- 3. O CÉREBRO DA ANÁLISE: generate_compliance_report ---
+def generate_compliance_report(task, knowledge_state, progress=gr.Progress()):
     """
+    Esta função orquestra o processo de RAG com melhor feedback e tratamento de erros.
     """
+    try:
+        if not task:
+            return "Por favor, forneça uma tarefa de análise."
+        if not knowledge_state or not knowledge_state[0] or knowledge_state[1] is None:
+            return "⚠️ A base de conhecimento está vazia. Por favor, processe alguns ficheiros primeiro."
+        knowledge_base, knowledge_base_embeddings = knowledge_state
+        progress(0, desc="A iniciar análise...")
+        # Passo 1: Recuperação Ampla do Contexto
+        progress(0.1, desc="A recuperar contexto relevante do documento...")
+        search_query = "Informações completas do certificado de calibração"
+        question_embedding = retriever_model.encode(search_query, convert_to_tensor=True)
+        cosine_scores = util.cos_sim(question_embedding, knowledge_base_embeddings)
+        top_k = min(15, len(knowledge_base))
+        top_results = torch.topk(cosine_scores, k=top_k, dim=-1)
+        retrieved_context = "\n\n---\n\n".join([knowledge_base[i] for i in top_results.indices[0]])
+        progress(0.4, desc="Contexto recuperado. A gerar o relatório com o modelo de IA (pode demorar)...")
+        # Passo 2: Geração com "Super-Prompt"
+        final_prompt = f"""### Instruction:
 Você é um auditor de metrologia a preencher um relatório de conformidade. Com base no 'Contexto do Documento' fornecido, preencha cada item da 'Checklist de Análise' abaixo. Se uma informação não for encontrada no contexto, escreva 'Não encontrado'.
 **Contexto do Documento:**
 ### Response:
 """
+        input_ids = generator_tokenizer(final_prompt, return_tensors="pt").input_ids
+        # Parâmetros de geração otimizados
+        outputs = generator_model.generate(
+            input_ids,
+            max_new_tokens=800,  # Reduzido para maior eficiência
+            do_sample=False,
+            pad_token_id=generator_tokenizer.eos_token_id
+        )
+        progress(0.9, desc="A formatar o relatório final...")
+        final_report = generator_tokenizer.decode(outputs[0], skip_special_tokens=True)
+        # Limpa a resposta para remover o prompt inicial
+        if "### Response:" in final_report:
+            final_report = final_report.split("### Response:")[1].strip()
+        progress(1, desc="Análise concluída.")
+        return final_report
+    except Exception as e:
+        # Tratamento de erros para retornar uma mensagem clara ao utilizador
+        print(f"Ocorreu um erro durante a geração do relatório: {e}")
+        return f"### ⚠️ Ocorreu um erro durante a análise.\n\n**Causa provável:** O modelo de IA pode ter excedido os limites de memória ou tempo. Por favor, tente novamente com um documento mais simples ou verifique os logs para mais detalhes.\n\n**Detalhes do Erro:** {str(e)}"
 # --- 4. Interface Gráfica (Simplificada para o novo fluxo) ---
     knowledge_state = gr.State()
     gr.Markdown(
         """
+        # 🤖 Agente de Análise de Conformidade Metrológica (v14 - Robusto)
         **1. Carregue um documento**: Envie um certificado de calibração (`.pdf` ou `.txt`).
         **2. Processe o documento**: Clique no botão para criar a base de conhecimento.
         **3. Inicie a Análise**: Dê uma tarefa ao agente (ex: "Analisar conformidade deste certificado") e clique em "Iniciar Análise".
             submit_button = gr.Button("Iniciar Análise", variant="primary")
     with gr.Row():
+        report_box = gr.Markdown(label="Relatório Final de Análise")
+    # A chamada de click continua a mesma, pois o gr.Progress é gerido dentro da função
     process_button.click(fn=process_files, inputs=[file_uploader], outputs=[knowledge_state, status_box])
     submit_button.click(fn=generate_compliance_report, inputs=[task_box, knowledge_state], outputs=[report_box])
 # --- 5. Lançamento do App ---
 if __name__ == "__main__":
+    interface.launch()