Spaces:

tensorkelechi
/

text_pdf_summarizer

Runtime error

tensorkelechi commited on Feb 12, 2024

Commit

758f813

verified ·

1 Parent(s): 37ff84b

Change to raw output

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,4 @@
 import streamlit as st
-import pdfkit
 from PyPDF2 import PdfReader
 from transformers import pipeline
@@ -29,9 +28,9 @@ if st.button('Summarize text'):
     st.markdown(f'''
             <div style="background-color: black; color: white; font-weight: bold; padding: 1rem; border-radius: 10px;">
             <h4>Results</h4>
-                <p>
                     {output}
-                </p>
             </div>
                 ''', unsafe_allow_html=True)
     st.success('Done')
@@ -61,15 +60,18 @@ try:
         for page in pages:
             page_text = page.extract_text()
             page_text_stack.append(page_text)
-        # pages_stack = []
-        # for text_stack in page_text_stack:
-        #     pages_stack.append(text_stack)
         return page_text_stack
 except: # Handle blank file error
@@ -77,11 +79,7 @@ except: # Handle blank file error
 #  Prepare output
-pdf_input = extract_text(uploaded_pdf)
-pdf_output = summarize_text(pdf_input)
-summary_pdf = pdfkit.from_string(pdf_output, 'Summary.pdf')
@@ -90,7 +88,7 @@ if st.button('Summarize pdf page'):
             <div style="background-color: black; color: white; font-weight: bold; padding: 1rem; border-radius: 10px;">
             <h4>Download the summary here </h4>
                 <p>
-                    {pdf_output}
                 </p>
             </div>
                 ''', unsafe_allow_html=True)

 import streamlit as st
 from PyPDF2 import PdfReader
 from transformers import pipeline
     st.markdown(f'''
             <div style="background-color: black; color: white; font-weight: bold; padding: 1rem; border-radius: 10px;">
             <h4>Results</h4>
+                <div>
                     {output}
+                </div>
             </div>
                 ''', unsafe_allow_html=True)
     st.success('Done')
         for page in pages:
             page_text = page.extract_text()
             page_text_stack.append(page_text)
         return page_text_stack
+    pdf_input = extract_text(uploaded_pdf)
+    pdf_output = []
+    for stack in pdf_input:
+        summarize_text(stack)
+        pdf_output.append(stack)
+    pdf_summary = '\n'.join(pdf_output)
 except: # Handle blank file error
 #  Prepare output
+# summary_pdf = pdfkit.from_string(pdf_output, 'Summary.pdf')
             <div style="background-color: black; color: white; font-weight: bold; padding: 1rem; border-radius: 10px;">
             <h4>Download the summary here </h4>
                 <p>
+                    {pdf_summary}
                 </p>
             </div>
                 ''', unsafe_allow_html=True)