Spaces:

DHEIVER
/

rag_trescal

Sleeping

App Files Files Community

DHEIVER commited on Jun 9

Commit

963b058

verified ·

1 Parent(s): be1ab03

Update app.py

Browse files

Files changed (1) hide show

app.py +63 -80

app.py CHANGED Viewed

@@ -28,7 +28,6 @@ def process_files(files):
     knowledge_text = ""
     for file in files:
-        # ... (código de extração de texto de PDF/TXT permanece o mesmo) ...
         file_path = file.name
         if file_path.endswith(".pdf"):
             try:
@@ -80,99 +79,86 @@ def find_info(question, knowledge_state):
     question_embedding = retriever_model.encode(question, convert_to_tensor=True)
     cosine_scores = util.cos_sim(question_embedding, knowledge_base_embeddings)
-    top_k = min(5, len(knowledge_base)) # Reduzido para ser mais focado
     top_results = torch.topk(cosine_scores, k=top_k, dim=-1)
     retrieved_context = "\n---\n".join([knowledge_base[i] for i in top_results.indices[0]])
-    prompt = f"### Instruction:\nExtraia a informação exata para responder à pergunta com base no contexto. Seja direto.\n\nContexto:\n{retrieved_context}\n\nPergunta:\n{question}\n\n### Response:"
     input_ids = generator_tokenizer(prompt, return_tensors="pt").input_ids
-    outputs = generator_model.generate(input_ids, max_new_tokens=100, do_sample=False, pad_token_id=generator_tokenizer.eos_token_id)
     answer = generator_tokenizer.decode(outputs[0, input_ids.shape[1]:], skip_special_tokens=True)
     return answer.strip()
 # --- 4. O CÉREBRO DO AGENTE: evaluate_document ---
-def evaluate_document(task, knowledge_state):
     """Esta é a função principal do agente. Ela orquestra as chamadas à ferramenta 'find_info'
-       para construir um relatório de avaliação completo."""
     if not task:
-        return "Por favor, forneça uma tarefa de avaliação.", ""
     if not knowledge_state or not knowledge_state[0] or knowledge_state[1] is None:
-        return "⚠️ A base de conhecimento está vazia. Por favor, processe alguns ficheiros primeiro.", ""
-    thought_process = "Iniciando a avaliação do documento...\n"
-    # Passo 1: Identificação
-    thought_process += "Passo 1: A identificar o cliente e o instrumento...\n"
-    client_info = find_info("Qual o nome do cliente ou contratante?", knowledge_state)
-    instrument_info = find_info("Qual é a descrição, TAG ou modelo do instrumento calibrado?", knowledge_state)
-    thought_process += f"  - Cliente Encontrado: {client_info}\n"
-    thought_process += f"  - Instrumento Encontrado: {instrument_info}\n\n"
-    # Passo 2: Resultado e Incerteza
-    thought_process += "Passo 2: A verificar o resultado da calibração e a incerteza...\n"
-    result_info = find_info("Qual foi o resultado final da calibração (ex: Aprovado, Reprovado)?", knowledge_state)
-    uncertainty_info = find_info("Qual é a incerteza de medição reportada?", knowledge_state)
-    thought_process += f"  - Resultado: {result_info}\n"
-    thought_process += f"  - Incerteza: {uncertainty_info}\n\n"
-    # Passo 3: Validade
-    thought_process += "Passo 3: A verificar as datas...\n"
-    calibration_date = find_info("Qual foi a data em que a calibração foi realizada?", knowledge_state)
-    due_date = find_info("Qual a data de vencimento ou próxima calibração?", knowledge_state)
-    thought_process += f"  - Data da Calibração: {calibration_date}\n"
-    thought_process += f"  - Data de Vencimento: {due_date}\n\n"
-    # Passo 4: Geração do Relatório Final
-    thought_process += "Passo 4: A compilar o relatório final...\n"
-    final_prompt = f"""### Instruction:
-Você é um auditor de metrologia a escrever um relatório de avaliação. Com base nos 'Dados Recolhidos' abaixo, escreva um parecer técnico conciso e estruturado.
-**Dados Recolhidos:**
-- Cliente: {client_info}
-- Instrumento: {instrument_info}
-- Resultado da Calibração: {result_info}
-- Incerteza de Medição: {uncertainty_info}
-- Data da Execução: {calibration_date}
-- Próxima Calibração: {due_date}
-### Response:
-**Relatório de Avaliação do Certificado**
-**1. Identificação:**
-   - **Cliente:** [Preencha com o cliente]
-   - **Instrumento:** [Preencha com o instrumento]
-**2. Análise Técnica:**
-   - **Resultado:** [Preencha com o resultado]
-   - **Incerteza:** [Preencha com a incerteza]
-   - **Conformidade:** [Comente brevemente se o resultado 'Aprovado' é consistente com os dados]
-**3. Validade:**
-   - **Data da Calibração:** [Preencha com a data]
-   - **Validade:** [Preencha com a data de vencimento]
-**4. Parecer Final:**
-   - [Escreva uma frase de conclusão sobre a validade e aceitabilidade do certificado com base nos dados.]
-"""
-    input_ids = generator_tokenizer(final_prompt, return_tensors="pt").input_ids
-    outputs = generator_model.generate(input_ids, max_new_tokens=400, do_sample=False, pad_token_id=generator_tokenizer.eos_token_id)
-    final_report = generator_tokenizer.decode(outputs[0, input_ids.shape[1]:], skip_special_tokens=True)
-    thought_process += "Avaliação concluída."
-    return thought_process, final_report
 # --- 5. Interface Gráfica (Atualizada para o Agente) ---
 with gr.Blocks(theme=gr.themes.Soft()) as interface:
     knowledge_state = gr.State()
     gr.Markdown(
         """
-        # 🤖 Agente de Avaliação de Documentos de Metrologia
-        **1. Carregue um documento**: Envie um certificado de calibração em `.pdf` ou `.txt`.
         **2. Processe o documento**: Clique no botão para criar a base de conhecimento.
-        **3. Inicie a Avaliação**: Dê uma tarefa ao agente (ex: "Avalie este certificado") e clique em "Iniciar Avaliação".
         """
     )
@@ -183,17 +169,14 @@ with gr.Blocks(theme=gr.themes.Soft()) as interface:
             status_box = gr.Textbox(label="Status do Processamento", interactive=False)
         with gr.Column(scale=2):
-            task_box = gr.Textbox(label="Tarefa de Avaliação", placeholder='Ex: Avalie este certificado de calibração.')
-            submit_button = gr.Button("Iniciar Avaliação", variant="primary")
     with gr.Row():
-        with gr.Column():
-            thought_box = gr.Textbox(label="Passos do Agente", interactive=False, lines=15)
-        with gr.Column():
-            report_box = gr.Textbox(label="Relatório Final de Avaliação", interactive=False, lines=15)
     process_button.click(fn=process_files, inputs=[file_uploader], outputs=[knowledge_state, status_box])
-    submit_button.click(fn=evaluate_document, inputs=[task_box, knowledge_state], outputs=[thought_box, report_box])
 # --- 6. Lançamento do App ---
 if __name__ == "__main__":

     knowledge_text = ""
     for file in files:
         file_path = file.name
         if file_path.endswith(".pdf"):
             try:
     question_embedding = retriever_model.encode(question, convert_to_tensor=True)
     cosine_scores = util.cos_sim(question_embedding, knowledge_base_embeddings)
+    top_k = min(5, len(knowledge_base))
     top_results = torch.topk(cosine_scores, k=top_k, dim=-1)
     retrieved_context = "\n---\n".join([knowledge_base[i] for i in top_results.indices[0]])
+    prompt = f"### Instruction:\nExtraia a informação exata para responder à pergunta com base no contexto. Se a informação não for encontrada, responda 'Não encontrado'. Seja direto.\n\nContexto:\n{retrieved_context}\n\nPergunta:\n{question}\n\n### Response:"
     input_ids = generator_tokenizer(prompt, return_tensors="pt").input_ids
+    outputs = generator_model.generate(input_ids, max_new_tokens=150, do_sample=False, pad_token_id=generator_tokenizer.eos_token_id)
     answer = generator_tokenizer.decode(outputs[0, input_ids.shape[1]:], skip_special_tokens=True)
     return answer.strip()
 # --- 4. O CÉREBRO DO AGENTE: evaluate_document ---
+def evaluate_document(task, knowledge_state, progress=gr.Progress(track_tqdm=True)):
     """Esta é a função principal do agente. Ela orquestra as chamadas à ferramenta 'find_info'
+       para construir um relatório de avaliação completo, seguindo uma checklist."""
     if not task:
+        return "Por favor, forneça uma tarefa de avaliação."
     if not knowledge_state or not knowledge_state[0] or knowledge_state[1] is None:
+        return "⚠️ A base de conhecimento está vazia. Por favor, processe alguns ficheiros primeiro."
+    # Checklist de avaliação baseada na sua solicitação
+    checklist = {
+        "1. Incerteza de Medição": [
+            ("1.1 a 1.2 Casas Decimais / Compatibilidade", "Qual a incerteza de medição declarada e o número de casas decimais dos resultados?"),
+            ("1.3 Nível de Confiança, Fator de Abrangência (k) e Graus de Liberdade", "Qual o nível de confiança, fator de abrangência (k) e graus de liberdade declarados para a incerteza?"),
+            ("1.4 Declaração de Rastreabilidade dos Resultados", "Existe uma declaração de que os resultados se referem somente aos itens calibrados?")
+        ],
+        "2. Resultados da Calibração": [
+            ("2.1 a 2.3 Unidades SI, Casas Decimais e Algarismos Significativos", "Os resultados da calibração são apresentados com unidades do Sistema Internacional (SI)? Qual o mensurando e a quantidade de algarismos significativos?"),
+        ],
+        "3. Conformidade da Faixa": [
+            ("3.1 Faixa e Especificações Solicitadas", "A calibração foi realizada na faixa de utilização especificada ou solicitada?")
+        ],
+        "4. Condições Ambientais": [
+            ("4.1 Registro das Condições e Incerteza Associada", "Quais foram as condições ambientais (temperatura, umidade) registadas durante a calibração? Há menção de incerteza associada a elas?")
+        ],
+        "5. Identificação do Item": [
+            ("5.1 Descrição e Identificação do Item", "Qual a descrição completa e identificação do item calibrado (nome, fabricante, tipo, modelo, número de série)?")
+        ],
+        "6. Identificação do Método": [
+            ("6.1 Método/Procedimento Utilizado", "Qual o método ou procedimento de calibração utilizado?")
+        ],
+        "7. Identificação do Cliente": [
+            ("7.1 Nome e Endereço do Cliente", "Qual o nome e o endereço do cliente/contratante?")
+        ],
+        "8. Identificação do Laboratório": [
+            ("8.1 Nome e Endereço do Laboratório", "Qual o nome e o endereço do laboratório que emitiu o certificado?")
+        ],
+        "9. Identificação do Certificado": [
+            ("9.1 Número do Certificado", "Qual o número de identificação unívoca do certificado?")
+        ],
+        "10. Autorização": [
+            ("10.1 Pessoas Autorizadas", "Quem são os responsáveis (nome e função) pela emissão ou assinatura do certificado?")
+        ]
+    }
+    report = f"# Relatório de Análise de Conformidade\n\n**Tarefa:** {task}\n\n---\n\n"
+    # Itera sobre a checklist, fazendo perguntas ao documento para cada item
+    for section, questions in progress.tqdm(checklist.items(), desc="A avaliar documento..."):
+        report += f"## {section}\n\n"
+        for sub_item, question in questions:
+            # O agente "pergunta" ao documento
+            answer = find_info(question, knowledge_state)
+            # Adiciona a resposta ao relatório
+            report += f"**{sub_item}:**\n{answer}\n\n"
+        report += "---\n\n"
+    return report
 # --- 5. Interface Gráfica (Atualizada para o Agente) ---
 with gr.Blocks(theme=gr.themes.Soft()) as interface:
     knowledge_state = gr.State()
     gr.Markdown(
         """
+        # 🤖 Agente de Análise de Conformidade Metrológica
+        **1. Carregue um documento**: Envie um certificado de calibração (`.pdf` ou `.txt`).
         **2. Processe o documento**: Clique no botão para criar a base de conhecimento.
+        **3. Inicie a Análise**: Dê uma tarefa ao agente (ex: "Analisar conformidade deste certificado") e clique em "Iniciar Análise".
         """
     )
             status_box = gr.Textbox(label="Status do Processamento", interactive=False)
         with gr.Column(scale=2):
+            task_box = gr.Textbox(label="Tarefa de Análise", placeholder='Ex: Avaliar a conformidade deste certificado de calibração.')
+            submit_button = gr.Button("Iniciar Análise", variant="primary")
     with gr.Row():
+        report_box = gr.Markdown(label="Relatório Final de Análise")
     process_button.click(fn=process_files, inputs=[file_uploader], outputs=[knowledge_state, status_box])
+    submit_button.click(fn=evaluate_document, inputs=[task_box, knowledge_state], outputs=[report_box])
 # --- 6. Lançamento do App ---
 if __name__ == "__main__":