pdfchatbot

Runtime error

App Files Files Community

DHEIVER commited on Jan 28

Commit

302b740

verified ·

1 Parent(s): b8f9c6f

Update app.py

Browse files

Files changed (1) hide show

app.py +58 -137

app.py CHANGED Viewed

@@ -184,124 +184,59 @@ def upload_file(file_obj):
         list_file_path.append(file_path)
     return list_file_path
-# CSS personalizado para ocultar elementos da interface
-custom_css = """
-#banner {
-    display: none !important;
-}
-footer {
-    display: none !important;
-}
-"""
-import gradio as gr
-# Funções fictícias para os eventos
-def initialize_database(document, chunk_size, chunk_overlap):
-    # Lógica para inicializar o banco de dados vetorial
-    vector_db = "Banco de Dados Vetorial Inicializado"
-    collection_name = "Coleção 1"
-    db_progress = "Banco de Dados Inicializado"
-    return vector_db, collection_name, db_progress
-def initialize_LLM(llm_model, temperature, max_tokens, top_k, vector_db):
-    # Lógica para inicializar a cadeia LLM
-    qa_chain = "Cadeia de QA Inicializada"
-    llm_progress = "Cadeia LLM Inicializada"
-    return qa_chain, llm_progress
-def conversation(qa_chain, message, chatbot):
-    # Lógica de processamento de mensagem do chatbot
-    response = f"Resposta para: {message}"
-    doc_source1 = "Fonte 1"
-    source1_page = 1
-    doc_source2 = "Fonte 2"
-    source2_page = 2
-    doc_source3 = "Fonte 3"
-    source3_page = 3
-    chatbot.append((message, response))
-    return qa_chain, message, chatbot, doc_source1, source1_page, doc_source2, source2_page, doc_source3, source3_page
-# Interface Gradio
 def demo():
-    with gr.Blocks(theme=gr.themes.Default(primary_hue="blue", secondary_hue="gray"), css=None) as demo:
-        # Barra superior personalizada
-        with gr.Row(visible=True, elem_id="top_bar"):
-            gr.Image(value="https://huggingface.co/front/assets/huggingface_logo-noborder.svg",
-                     interactive=False, show_label=False, elem_classes="logo")
-            gr.Markdown(
-                """
-                <div style="text-align:right; padding-right: 15px;">
-                    <a href="https://huggingface.co/" target="_blank" style="text-decoration:none;">
-                        <b>Voltar à Web HuggingCode</b>
-                    </a>
-                </div>
-                """
-            )
-        # Cabeçalho
         gr.Markdown(
-            """
-            <center><h2>Chatbot baseado em PDF</h2></center>
-            <h3>Faça perguntas sobre seus documentos PDF</h3>
-            """
-        )
         gr.Markdown(
-            """
-            <b>Nota:</b> Este assistente AI, usando Langchain e LLMs de código aberto, realiza geração aumentada por recuperação (RAG) a partir de seus documentos PDF. \
-            A interface do usuário explicitamente mostra múltiplos passos para ajudar a entender o fluxo de trabalho do RAG.
-            Este chatbot leva em consideração perguntas anteriores ao gerar respostas (via memória conversacional) e inclui referências de documentos para maior clareza.<br>
-            <br><b>Aviso:</b> Este espaço usa o hardware básico gratuito da Hugging Face. Alguns passos e modelos LLM usados abaixo (endpoints de inferência gratuitos) podem levar algum tempo para gerar uma resposta.
-            """
-        )
-        # Passo 1 - Upload do PDF
-        with gr.Tab("Passo 1 - Carregar PDF"):
             with gr.Row():
-                document = gr.Files(height=100, file_count="multiple", file_types=["pdf"], interactive=True,
-                                 label="Carregue seus documentos PDF (único ou múltiplos)")
-        # Passo 2 - Processamento do documento
-        with gr.Tab("Passo 2 - Processar documento"):
             with gr.Row():
-                db_btn = gr.Radio(["ChromaDB"], label="Tipo de banco de dados vetorial", value="ChromaDB",
-                                type="index", info="Escolha seu banco de dados vetorial")
             with gr.Accordion("Opções avançadas - Divisor de texto do documento", open=False):
                 with gr.Row():
-                    slider_chunk_size = gr.Slider(minimum=100, maximum=1000, value=600, step=20,
-                                                label="Tamanho do chunk", info="Tamanho do chunk", interactive=True)
                 with gr.Row():
-                    slider_chunk_overlap = gr.Slider(minimum=10, maximum=200, value=40, step=10,
-                                                   label="Sobreposição do chunk", info="Sobreposição do chunk", interactive=True)
             with gr.Row():
                 db_progress = gr.Textbox(label="Inicialização do banco de dados vetorial", value="Nenhum")
             with gr.Row():
-                process_btn = gr.Button("Gerar banco de dados vetorial")
-        # Passo 3 - Configuração da cadeia QA
-        with gr.Tab("Passo 3 - Inicializar cadeia de QA"):
             with gr.Row():
-                llm_btn = gr.Radio(["Model 1", "Model 2"], label="Modelos LLM", value="Model 1",
-                                 type="index", info="Escolha seu modelo LLM")
             with gr.Accordion("Opções avançadas - Modelo LLM", open=False):
                 with gr.Row():
-                    slider_temperature = gr.Slider(minimum=0.01, maximum=1.0, value=0.7, step=0.1,
-                                                 label="Temperatura", info="Temperatura do modelo", interactive=True)
                 with gr.Row():
-                    slider_maxtokens = gr.Slider(minimum=224, maximum=4096, value=1024, step=32,
-                                               label="Máximo de Tokens", info="Máximo de tokens do modelo", interactive=True)
                 with gr.Row():
-                    slider_topk = gr.Slider(minimum=1, maximum=10, value=3, step=1,
-                                          label="Amostras top-k", info="Amostras top-k do modelo", interactive=True)
             with gr.Row():
-                llm_progress = gr.Textbox(value="Nenhum", label="Inicialização da cadeia de QA")
             with gr.Row():
-                qa_init_btn = gr.Button("Inicializar cadeia de Perguntas e Respostas")
-        # Passo 4 - Interface do Chatbot
-        with gr.Tab("Passo 4 - Chatbot"):
             chatbot = gr.Chatbot(height=300)
-            with gr.Accordion("Avançado - Referências de documentos", open=False):
                 with gr.Row():
                     doc_source1 = gr.Textbox(label="Referência 1", lines=2, container=True, scale=20)
                     source1_page = gr.Number(label="Página", scale=1)
@@ -312,52 +247,38 @@ def demo():
                     doc_source3 = gr.Textbox(label="Referência 3", lines=2, container=True, scale=20)
                     source3_page = gr.Number(label="Página", scale=1)
             with gr.Row():
-                msg = gr.Textbox(placeholder="Digite uma mensagem (ex: 'Sobre o que é este documento?')", container=True)
             with gr.Row():
                 submit_btn = gr.Button("Enviar mensagem")
                 clear_btn = gr.ClearButton([msg, chatbot], value="Limpar conversa")
         # Eventos de pré-processamento
-        process_btn.click(
-            initialize_database,
-            inputs=[document, slider_chunk_size, slider_chunk_overlap],
-            outputs=[db_progress]
-        )
-        qa_init_btn.click(
-            initialize_LLM,
-            inputs=[llm_btn, slider_temperature, slider_maxtokens, slider_topk, db_progress],
-            outputs=[llm_progress]
-        ).then(
-            lambda: [None, "", 0, "", 0, "", 0],
-            inputs=None,
-            outputs=[chatbot, doc_source1, source1_page, doc_source2, source2_page, doc_source3, source3_page],
-            queue=False
-        )
-        # Eventos do chatbot
-        msg.submit(
-            conversation,
-            inputs=[qa_chain, msg, chatbot],
-            outputs=[qa_chain, msg, chatbot, doc_source1, source1_page, doc_source2, source2_page, doc_source3, source3_page],
-            queue=False
-        )
-        submit_btn.click(
-            conversation,
-            inputs=[qa_chain, msg, chatbot],
-            outputs=[qa_chain, msg, chatbot, doc_source1, source1_page, doc_source2, source2_page, doc_source3, source3_page],
-            queue=False
-        )
-        clear_btn.click(
-            lambda: [None, "", 0, "", 0, "", 0],
-            inputs=None,
-            outputs=[chatbot, doc_source1, source1_page, doc_source2, source2_page, doc_source3, source3_page],
-            queue=False
-        )
     demo.queue().launch(debug=True)
 if __name__ == "__main__":
     demo()

         list_file_path.append(file_path)
     return list_file_path
 def demo():
+    with gr.Blocks(theme="base") as demo:
+        vector_db = gr.State()
+        qa_chain = gr.State()
+        collection_name = gr.State()
         gr.Markdown(
+        """<center><h2>Chatbot baseado em PDF</center></h2>
+        <h3>Faça qualquer pergunta sobre seus documentos PDF</h3>""")
         gr.Markdown(
+        """<b>Nota:</b> Este assistente de IA, utilizando Langchain e LLMs de código aberto, realiza geração aumentada por recuperação (RAG) a partir de seus documentos PDF. \
+        A interface do usuário mostra explicitamente várias etapas para ajudar a entender o fluxo de trabalho do RAG.
+        Este chatbot leva em consideração perguntas anteriores ao gerar respostas (via memória conversacional), e inclui referências documentais para maior clareza.<br>
+        <br><b>Aviso:</b> Este espaço usa a CPU básica gratuita do Hugging Face. Algumas etapas e modelos LLM utilizados abaixo (pontos finais de inferência gratuitos) podem levar algum tempo para gerar uma resposta.
+        """)
+        with gr.Tab("Etapa 1 - Carregar PDF"):
             with gr.Row():
+                document = gr.Files(height=100, file_count="multiple", file_types=["pdf"], interactive=True, label="Carregue seus documentos PDF (único ou múltiplos)")
+                # upload_btn = gr.UploadButton("Carregando documento...", height=100, file_count="multiple", file_types=["pdf"], scale=1)
+        with gr.Tab("Etapa 2 - Processar documento"):
             with gr.Row():
+                db_btn = gr.Radio(["ChromaDB"], label="Tipo de banco de dados vetorial", value = "ChromaDB", type="index", info="Escolha o banco de dados vetorial")
             with gr.Accordion("Opções avançadas - Divisor de texto do documento", open=False):
                 with gr.Row():
+                    slider_chunk_size = gr.Slider(minimum = 100, maximum = 1000, value=600, step=20, label="Tamanho do bloco", info="Tamanho do bloco", interactive=True)
                 with gr.Row():
+                    slider_chunk_overlap = gr.Slider(minimum = 10, maximum = 200, value=40, step=10, label="Sobreposição do bloco", info="Sobreposição do bloco", interactive=True)
             with gr.Row():
                 db_progress = gr.Textbox(label="Inicialização do banco de dados vetorial", value="Nenhum")
             with gr.Row():
+                db_btn = gr.Button("Gerar banco de dados vetorial")
+        with gr.Tab("Etapa 3 - Inicializar cadeia de QA"):
             with gr.Row():
+                llm_btn = gr.Radio(list_llm_simple, \
+                    label="Modelos LLM", value = list_llm_simple[0], type="index", info="Escolha seu modelo LLM")
             with gr.Accordion("Opções avançadas - Modelo LLM", open=False):
                 with gr.Row():
+                    slider_temperature = gr.Slider(minimum = 0.01, maximum = 1.0, value=0.7, step=0.1, label="Temperatura", info="Temperatura do modelo", interactive=True)
                 with gr.Row():
+                    slider_maxtokens = gr.Slider(minimum = 224, maximum = 4096, value=1024, step=32, label="Máximo de Tokens", info="Máximo de tokens do modelo", interactive=True)
                 with gr.Row():
+                    slider_topk = gr.Slider(minimum = 1, maximum = 10, value=3, step=1, label="Amostras top-k", info="Amostras top-k do modelo", interactive=True)
             with gr.Row():
+                llm_progress = gr.Textbox(value="Nenhum",label="Inicialização da cadeia QA")
             with gr.Row():
+                qachain_btn = gr.Button("Inicializar cadeia de Pergunta e Resposta")
+        with gr.Tab("Etapa 4 - Chatbot"):
             chatbot = gr.Chatbot(height=300)
+            with gr.Accordion("Avançado - Referências do documento", open=False):
                 with gr.Row():
                     doc_source1 = gr.Textbox(label="Referência 1", lines=2, container=True, scale=20)
                     source1_page = gr.Number(label="Página", scale=1)
                     doc_source3 = gr.Textbox(label="Referência 3", lines=2, container=True, scale=20)
                     source3_page = gr.Number(label="Página", scale=1)
             with gr.Row():
+                msg = gr.Textbox(placeholder="Digite a mensagem (exemplo: 'Sobre o que é este documento?')", container=True)
             with gr.Row():
                 submit_btn = gr.Button("Enviar mensagem")
                 clear_btn = gr.ClearButton([msg, chatbot], value="Limpar conversa")
         # Eventos de pré-processamento
+        #upload_btn.upload(upload_file, inputs=[upload_btn], outputs=[document])
+        db_btn.click(initialize_database, \
+            inputs=[document, slider_chunk_size, slider_chunk_overlap], \
+            outputs=[vector_db, collection_name, db_progress])
+        qachain_btn.click(initialize_LLM, \
+            inputs=[llm_btn, slider_temperature, slider_maxtokens, slider_topk, vector_db], \
+            outputs=[qa_chain, llm_progress]).then(lambda:[None,"",0,"",0,"",0], \
+            inputs=None, \
+            outputs=[chatbot, doc_source1, source1_page, doc_source2, source2_page, doc_source3, source3_page], \
+            queue=False)
+        # Eventos do Chatbot
+        msg.submit(conversation, \
+            inputs=[qa_chain, msg, chatbot], \
+            outputs=[qa_chain, msg, chatbot, doc_source1, source1_page, doc_source2, source2_page, doc_source3, source3_page], \
+            queue=False)
+        submit_btn.click(conversation, \
+            inputs=[qa_chain, msg, chatbot], \
+            outputs=[qa_chain, msg, chatbot, doc_source1, source1_page, doc_source2, source2_page, doc_source3, source3_page], \
+            queue=False)
+        clear_btn.click(lambda:[None,"",0,"",0,"",0], \
+            inputs=None, \
+            outputs=[chatbot, doc_source1, source1_page, doc_source2, source2_page, doc_source3, source3_page], \
+            queue=False)
     demo.queue().launch(debug=True)
 if __name__ == "__main__":
     demo()