Spaces:

awacke1
/

VoiceGPT15

Sleeping

awacke1 commited on Jul 7, 2023

Commit

fc73efd

1 Parent(s): cad979c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -226,10 +226,10 @@ def pdf2txt(pdf_docs):
         # You need to replace the following lines with actual file reading
         # based on the file_extension
         if file_extension in ['txt', 'html', 'htm', 'py', 'xml', 'json']:
-            text += textract.process(str(file))
             text += f"\nExtracted text from {file_extension} file..."
         elif file_extension == 'pdf':
-            pdf_reader = PdfReader(file)
             for page in pdf_reader.pages:
                 text += page.extract_text()
             text += f"\nExtracted text from PDF file..."

         # You need to replace the following lines with actual file reading
         # based on the file_extension
         if file_extension in ['txt', 'html', 'htm', 'py', 'xml', 'json']:
+            text += textract.process(str(file.name))
             text += f"\nExtracted text from {file_extension} file..."
         elif file_extension == 'pdf':
+            pdf_reader = PdfReader(file.name)
             for page in pdf_reader.pages:
                 text += page.extract_text()
             text += f"\nExtracted text from PDF file..."