Spaces:

Waseem7711
/

RAG_Chat_Bot

Sleeping

Waseem7711 commited on Sep 2, 2024

Commit

d39f2ea

verified ·

1 Parent(s): df61c4d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -24,7 +24,7 @@ def extract_text_from_pdf(pdf_file):
     text = ""
     for page_num in range(doc.page_count):
         page = doc.load_page(page_num)
-        text += page.get_text()
     return text
 # Function to generate response from model
@@ -35,18 +35,19 @@ def generate_response(input_text, query, tokenizer, model):
     Based on the following context/document:
     {input_text}
     Please answer the question: {query}
     ### Response:
     """
-    input_ids = tokenizer(prompt, return_tensors="pt")
     if torch.cuda.is_available():
         input_ids = input_ids.to("cuda")
     # Generate a response from the model
     outputs = model.generate(
-        **input_ids,
         max_new_tokens=500,
         no_repeat_ngram_size=5
     )
     # Decode the generated output into readable text
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
@@ -75,8 +76,11 @@ def main():
                     # Load the model and tokenizer
                     tokenizer, model = load_model()
                     # Generate the response using the model
-                    response = generate_response(pdf_text, query, tokenizer, model)
-                    st.text_area("Response", response, height=200)
 if __name__ == "__main__":
     main()

     text = ""
     for page_num in range(doc.page_count):
         page = doc.load_page(page_num)
+        text += page.get_text("text")  # Ensure text extraction
     return text
 # Function to generate response from model
     Based on the following context/document:
     {input_text}
     Please answer the question: {query}
     ### Response:
     """
+    input_ids = tokenizer(prompt, return_tensors="pt").input_ids
     if torch.cuda.is_available():
         input_ids = input_ids.to("cuda")
     # Generate a response from the model
     outputs = model.generate(
+        input_ids=input_ids,
         max_new_tokens=500,
         no_repeat_ngram_size=5
     )
     # Decode the generated output into readable text
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
                     # Load the model and tokenizer
                     tokenizer, model = load_model()
                     # Generate the response using the model
+                    try:
+                        response = generate_response(pdf_text, query, tokenizer, model)
+                        st.text_area("Response", response, height=200)
+                    except Exception as e:
+                        st.error(f"Error generating response: {e}")
 if __name__ == "__main__":
     main()