Spaces:

DHEIVER
/

rag_trescal

Sleeping

App Files Files Community

DHEIVER commited on Jun 9

Commit

c2667bf

verified ·

1 Parent(s): 963b058

Update app.py

Browse files

Files changed (1) hide show

app.py +85 -74

app.py CHANGED Viewed

@@ -71,91 +71,102 @@ def process_files(files):
     return (structured_chunks, knowledge_base_embeddings), f"✅ Sucesso! {len(files)} ficheiro(s) processado(s), gerando {len(structured_chunks)} chunks estruturados."
-# --- 3. A FERRAMENTA PRINCIPAL DO AGENTE: find_info ---
-def find_info(question, knowledge_state):
-    """Esta função atua como a 'ferramenta de busca' do agente. Ela não dá a resposta final,
-       apenas extrai a informação bruta pedida."""
     knowledge_base, knowledge_base_embeddings = knowledge_state
-    question_embedding = retriever_model.encode(question, convert_to_tensor=True)
     cosine_scores = util.cos_sim(question_embedding, knowledge_base_embeddings)
-    top_k = min(5, len(knowledge_base))
     top_results = torch.topk(cosine_scores, k=top_k, dim=-1)
-    retrieved_context = "\n---\n".join([knowledge_base[i] for i in top_results.indices[0]])
-    prompt = f"### Instruction:\nExtraia a informação exata para responder à pergunta com base no contexto. Se a informação não for encontrada, responda 'Não encontrado'. Seja direto.\n\nContexto:\n{retrieved_context}\n\nPergunta:\n{question}\n\n### Response:"
-    input_ids = generator_tokenizer(prompt, return_tensors="pt").input_ids
-    outputs = generator_model.generate(input_ids, max_new_tokens=150, do_sample=False, pad_token_id=generator_tokenizer.eos_token_id)
-    answer = generator_tokenizer.decode(outputs[0, input_ids.shape[1]:], skip_special_tokens=True)
-    return answer.strip()
-# --- 4. O CÉREBRO DO AGENTE: evaluate_document ---
-def evaluate_document(task, knowledge_state, progress=gr.Progress(track_tqdm=True)):
-    """Esta é a função principal do agente. Ela orquestra as chamadas à ferramenta 'find_info'
-       para construir um relatório de avaliação completo, seguindo uma checklist."""
-    if not task:
-        return "Por favor, forneça uma tarefa de avaliação."
-    if not knowledge_state or not knowledge_state[0] or knowledge_state[1] is None:
-        return "⚠️ A base de conhecimento está vazia. Por favor, processe alguns ficheiros primeiro."
-    # Checklist de avaliação baseada na sua solicitação
-    checklist = {
-        "1. Incerteza de Medição": [
-            ("1.1 a 1.2 Casas Decimais / Compatibilidade", "Qual a incerteza de medição declarada e o número de casas decimais dos resultados?"),
-            ("1.3 Nível de Confiança, Fator de Abrangência (k) e Graus de Liberdade", "Qual o nível de confiança, fator de abrangência (k) e graus de liberdade declarados para a incerteza?"),
-            ("1.4 Declaração de Rastreabilidade dos Resultados", "Existe uma declaração de que os resultados se referem somente aos itens calibrados?")
-        ],
-        "2. Resultados da Calibração": [
-            ("2.1 a 2.3 Unidades SI, Casas Decimais e Algarismos Significativos", "Os resultados da calibração são apresentados com unidades do Sistema Internacional (SI)? Qual o mensurando e a quantidade de algarismos significativos?"),
-        ],
-        "3. Conformidade da Faixa": [
-            ("3.1 Faixa e Especificações Solicitadas", "A calibração foi realizada na faixa de utilização especificada ou solicitada?")
-        ],
-        "4. Condições Ambientais": [
-            ("4.1 Registro das Condições e Incerteza Associada", "Quais foram as condições ambientais (temperatura, umidade) registadas durante a calibração? Há menção de incerteza associada a elas?")
-        ],
-        "5. Identificação do Item": [
-            ("5.1 Descrição e Identificação do Item", "Qual a descrição completa e identificação do item calibrado (nome, fabricante, tipo, modelo, número de série)?")
-        ],
-        "6. Identificação do Método": [
-            ("6.1 Método/Procedimento Utilizado", "Qual o método ou procedimento de calibração utilizado?")
-        ],
-        "7. Identificação do Cliente": [
-            ("7.1 Nome e Endereço do Cliente", "Qual o nome e o endereço do cliente/contratante?")
-        ],
-        "8. Identificação do Laboratório": [
-            ("8.1 Nome e Endereço do Laboratório", "Qual o nome e o endereço do laboratório que emitiu o certificado?")
-        ],
-        "9. Identificação do Certificado": [
-            ("9.1 Número do Certificado", "Qual o número de identificação unívoca do certificado?")
-        ],
-        "10. Autorização": [
-            ("10.1 Pessoas Autorizadas", "Quem são os responsáveis (nome e função) pela emissão ou assinatura do certificado?")
-        ]
-    }
-    report = f"# Relatório de Análise de Conformidade\n\n**Tarefa:** {task}\n\n---\n\n"
-    # Itera sobre a checklist, fazendo perguntas ao documento para cada item
-    for section, questions in progress.tqdm(checklist.items(), desc="A avaliar documento..."):
-        report += f"## {section}\n\n"
-        for sub_item, question in questions:
-            # O agente "pergunta" ao documento
-            answer = find_info(question, knowledge_state)
-            # Adiciona a resposta ao relatório
-            report += f"**{sub_item}:**\n{answer}\n\n"
-        report += "---\n\n"
-    return report
-# --- 5. Interface Gráfica (Atualizada para o Agente) ---
 with gr.Blocks(theme=gr.themes.Soft()) as interface:
     knowledge_state = gr.State()
     gr.Markdown(
         """
-        # 🤖 Agente de Análise de Conformidade Metrológica
         **1. Carregue um documento**: Envie um certificado de calibração (`.pdf` ou `.txt`).
         **2. Processe o documento**: Clique no botão para criar a base de conhecimento.
         **3. Inicie a Análise**: Dê uma tarefa ao agente (ex: "Analisar conformidade deste certificado") e clique em "Iniciar Análise".
@@ -176,8 +187,8 @@ with gr.Blocks(theme=gr.themes.Soft()) as interface:
         report_box = gr.Markdown(label="Relatório Final de Análise")
     process_button.click(fn=process_files, inputs=[file_uploader], outputs=[knowledge_state, status_box])
-    submit_button.click(fn=evaluate_document, inputs=[task_box, knowledge_state], outputs=[report_box])
-# --- 6. Lançamento do App ---
 if __name__ == "__main__":
     interface.launch()

     return (structured_chunks, knowledge_base_embeddings), f"✅ Sucesso! {len(files)} ficheiro(s) processado(s), gerando {len(structured_chunks)} chunks estruturados."
+# --- 3. O CÉREBRO DA ANÁLISE: generate_compliance_report ---
+def generate_compliance_report(task, knowledge_state, progress=gr.Progress(track_tqdm=True)):
+    """
+    Esta função orquestra todo o processo de RAG: recupera um contexto amplo e usa um único
+    'super-prompt' para gerar o relatório de conformidade completo de uma só vez.
+    """
+    if not task:
+        return "Por favor, forneça uma tarefa de análise."
+    if not knowledge_state or not knowledge_state[0] or knowledge_state[1] is None:
+        return "⚠️ A base de conhecimento está vazia. Por favor, processe alguns ficheiros primeiro."
     knowledge_base, knowledge_base_embeddings = knowledge_state
+    progress(0, desc="A recuperar contexto relevante...")
+    # Passo 1: Recuperação Ampla do Contexto
+    # Usamos uma pergunta genérica para recuperar os chunks mais relevantes do documento inteiro.
+    # Aumentamos o top_k para dar ao modelo uma visão mais completa.
+    search_query = "Informações completas do certificado de calibração"
+    question_embedding = retriever_model.encode(search_query, convert_to_tensor=True)
     cosine_scores = util.cos_sim(question_embedding, knowledge_base_embeddings)
+    top_k = min(15, len(knowledge_base)) # Aumentado para 15 para um contexto muito mais rico
     top_results = torch.topk(cosine_scores, k=top_k, dim=-1)
+    retrieved_context = "\n\n---\n\n".join([knowledge_base[i] for i in top_results.indices[0]])
+    progress(0.5, desc="A gerar o relatório de conformidade...")
+    # Passo 2: Geração com "Super-Prompt"
+    # Este prompt contém a checklist completa e instrui o modelo a preenchê-la.
+    final_prompt = f"""### Instruction:
+Você é um auditor de metrologia a preencher um relatório de conformidade. Com base no 'Contexto do Documento' fornecido, preencha cada item da 'Checklist de Análise' abaixo. Se uma informação não for encontrada no contexto, escreva 'Não encontrado'.
+**Contexto do Documento:**
+{retrieved_context}
+**Checklist de Análise:**
+# Relatório de Análise de Conformidade
+## 1. Incerteza de Medição
+   - **1.1 a 1.2 Casas Decimais / Compatibilidade:**
+   - **1.3 Nível de Confiança, Fator de Abrangência (k) e Graus de Liberdade:**
+   - **1.4 Declaração de Rastreabilidade dos Resultados:**
+## 2. Resultados da Calibração
+   - **2.1 a 2.3 Unidades SI, Casas Decimais e Algarismos Significativos:**
+## 3. Conformidade da Faixa
+   - **3.1 Faixa e Especificações Solicitadas:**
+## 4. Condições Ambientais
+   - **4.1 Registro das Condições e Incerteza Associada:**
+## 5. Identificação do Item
+   - **5.1 Descrição e Identificação do Item:**
+## 6. Identificação do Método
+   - **6.1 Método/Procedimento Utilizado:**
+## 7. Identificação do Cliente
+   - **7.1 Nome e Endereço do Cliente:**
+## 8. Identificação do Laboratório
+   - **8.1 Nome e Endereço do Laboratório:**
+## 9. Identificação do Certificado
+   - **9.1 Número do Certificado:**
+## 10. Autorização
+   - **10.1 Pessoas Autorizadas:**
+### Response:
+"""
+    input_ids = generator_tokenizer(final_prompt, return_tensors="pt").input_ids
+    outputs = generator_model.generate(
+        input_ids,
+        max_new_tokens=1024, # Aumentado para relatórios detalhados
+        do_sample=False,
+        pad_token_id=generator_tokenizer.eos_token_id
+    )
+    final_report = generator_tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # Limpa a resposta para remover o prompt inicial
+    if "### Response:" in final_report:
+        final_report = final_report.split("### Response:")[1].strip()
+    progress(1, desc="Análise concluída.")
+    return final_report
+# --- 4. Interface Gráfica (Simplificada para o novo fluxo) ---
 with gr.Blocks(theme=gr.themes.Soft()) as interface:
     knowledge_state = gr.State()
     gr.Markdown(
         """
+        # 🤖 Agente de Análise de Conformidade Metrológica (v12 - Robusto)
         **1. Carregue um documento**: Envie um certificado de calibração (`.pdf` ou `.txt`).
         **2. Processe o documento**: Clique no botão para criar a base de conhecimento.
         **3. Inicie a Análise**: Dê uma tarefa ao agente (ex: "Analisar conformidade deste certificado") e clique em "Iniciar Análise".
         report_box = gr.Markdown(label="Relatório Final de Análise")
     process_button.click(fn=process_files, inputs=[file_uploader], outputs=[knowledge_state, status_box])
+    submit_button.click(fn=generate_compliance_report, inputs=[task_box, knowledge_state], outputs=[report_box])
+# --- 5. Lançamento do App ---
 if __name__ == "__main__":
     interface.launch()