Spaces:

billusanda007
/

HireGPT

Sleeping

Jeet Paul commited on Aug 1, 2023

Commit

7423c0b

1 Parent(s): 7e0fd2a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -13,8 +13,10 @@ import pdfminer
 from pdfminer.high_level import extract_text
 import re
 import PyPDF2
-import docx
 import textract
 nltk.download('punkt')
 nltk.download('stopwords')
@@ -30,11 +32,6 @@ def preprocess_text(text):
     return ' '.join(words)
-import textract
-import tempfile
-import fitz  # PyMuPDF
 def extract_text_from_pdf(pdf_content):
     pdf_document = fitz.open(stream=pdf_content, filetype="pdf")
     text = ""
@@ -44,8 +41,6 @@ def extract_text_from_pdf(pdf_content):
     pdf_document.close()
     return text
-from docx import Document
 def extract_text_from_docx(docx_content):
     doc = Document(BytesIO(docx_content))
     text = " ".join(paragraph.text for paragraph in doc.paragraphs)
@@ -56,7 +51,6 @@ def extract_text_from_txt(txt_content):
     text = textract.process(input_filename=None, input_bytes=txt_content)
     return text
 def extract_text_from_resume(file_path):
     file_extension = file_path.split('.')[-1].lower()

 from pdfminer.high_level import extract_text
 import re
 import PyPDF2
 import textract
+import tempfile
+import fitz
+from docx import Document
 nltk.download('punkt')
 nltk.download('stopwords')
     return ' '.join(words)
 def extract_text_from_pdf(pdf_content):
     pdf_document = fitz.open(stream=pdf_content, filetype="pdf")
     text = ""
     pdf_document.close()
     return text
 def extract_text_from_docx(docx_content):
     doc = Document(BytesIO(docx_content))
     text = " ".join(paragraph.text for paragraph in doc.paragraphs)
     text = textract.process(input_filename=None, input_bytes=txt_content)
     return text
 def extract_text_from_resume(file_path):
     file_extension = file_path.split('.')[-1].lower()