Spaces:

masadonline
/

Quasa

Sleeping

masadonline commited on May 17

Commit

8b78680

verified ·

1 Parent(s): 0b29458

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -18,8 +18,9 @@ from pdfminer.layout import LAParams
 import datetime
-APP_START_TIME = datetime.datetime.utcnow()
 # --- PDF Extraction ---
 def extract_text_from_pdf(pdf_path):
     output_string = StringIO()
@@ -131,7 +132,7 @@ def setup_knowledge_base():
     tokenizer = AutoTokenizer.from_pretrained('bert-base-uncased')
     chunks = chunk_text(all_text, tokenizer)
     model = SentenceTransformer('all-mpnet-base-v2')
-    embeddings = model.encode(chunks, truncate=True, show_progress_bar=False)
     dim = embeddings[0].shape[0]
     index = faiss.IndexFlatL2(dim)
     index.add(np.array(embeddings).astype('float32'))

 import datetime
+APP_START_TIME = datetime.datetime.now(datetime.timezone.utc)
+os.environ["PYTORCH_JIT"] = "0"
 # --- PDF Extraction ---
 def extract_text_from_pdf(pdf_path):
     output_string = StringIO()
     tokenizer = AutoTokenizer.from_pretrained('bert-base-uncased')
     chunks = chunk_text(all_text, tokenizer)
     model = SentenceTransformer('all-mpnet-base-v2')
+    embeddings = model.encode(chunks, show_progress_bar=False, truncation=True, max_length=512)
     dim = embeddings[0].shape[0]
     index = faiss.IndexFlatL2(dim)
     index.add(np.array(embeddings).astype('float32'))