Spaces:

CCCDev
/

PDFChat

Sleeping

CCCDev commited on Jul 31, 2024

Commit

8defb93

verified ·

1 Parent(s): e80e929

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -22,8 +22,13 @@ import tqdm
 import accelerate
 import re
-list_llm = ["mistralai/Mistral-7B-Instruct-v0.2"]
-list_llm_simple = [os.path.basename(llm) for llm in list_llm]
 pdf_url = "https://huggingface.co/spaces/CCCDev/PDFChat/resolve/main/Privacy-Policy%20(1).pdf"  # Replace with your static PDF URL or path
@@ -106,9 +111,8 @@ def initialize_database(pdf_url, chunk_size, chunk_overlap, progress=gr.Progress
     return vector_db, collection_name, "Complete!"
-def initialize_LLM(llm_option, llm_temperature, max_tokens, top_k, vector_db, progress=gr.Progress()):
-    llm_name = list_llm[llm_option]
-    qa_chain = initialize_llmchain(llm_name, llm_temperature, max_tokens, top_k, vector_db, progress)
     return qa_chain, "Complete!"
@@ -188,8 +192,8 @@ def demo():
         llm_progress = gr.Textbox(value="None", label="QA chain initialization")
         def auto_initialize():
-            vector_db, collection_name, db_status = initialize_database(pdf_url, 1024, 24)
-            qa_chain, llm_status = initialize_LLM(0, 0.1, 1024, 20, vector_db)
             return vector_db, collection_name, db_status, qa_chain, llm_status, "Initialization complete."
         demo.load(auto_initialize, [], [vector_db, collection_name, db_progress, qa_chain, llm_progress])

 import accelerate
 import re
+LLM_MODEL = "mistralai/Mistral-7B-Instruct-v0.2"
+LLM_MAX_TOKEN = 512
+DB_CHUNK_SIZE = 512
+CHUNK_OVERLAP = 24
+TEMPERATURE = 0.1
+MAX_TOKENS = 512
+TOP_K = 20
 pdf_url = "https://huggingface.co/spaces/CCCDev/PDFChat/resolve/main/Privacy-Policy%20(1).pdf"  # Replace with your static PDF URL or path
     return vector_db, collection_name, "Complete!"
+def initialize_LLM(llm_temperature, max_tokens, top_k, vector_db, progress=gr.Progress()):
+    qa_chain = initialize_llmchain(LLM_MODEL, llm_temperature, max_tokens, top_k, vector_db, progress)
     return qa_chain, "Complete!"
         llm_progress = gr.Textbox(value="None", label="QA chain initialization")
         def auto_initialize():
+            vector_db, collection_name, db_status = initialize_database(pdf_url, DB_CHUNK_SIZE, CHUNK_OVERLAP)
+            qa_chain, llm_status = initialize_LLM(TEMPERATURE, LLM_MAX_TOKEN, 20, vector_db)
             return vector_db, collection_name, db_status, qa_chain, llm_status, "Initialization complete."
         demo.load(auto_initialize, [], [vector_db, collection_name, db_progress, qa_chain, llm_progress])