Spaces:

husseinelsaadi
/

Codingo

Paused

husseinelsaadi commited on 13 days ago

Commit

722e882

1 Parent(s): 2e9d967

updated

Files changed (2) hide show

backend/services/resume_parser.py CHANGED Viewed

@@ -6,7 +6,6 @@ import zipfile
 import json
 import torch
 from typing import List
-from transformers import AutoModelForCausalLM, AutoTokenizer
 os.environ["OMP_NUM_THREADS"] = "1"
 os.environ["OPENBLAS_NUM_THREADS"] = "1"
@@ -14,18 +13,25 @@ os.environ["MKL_NUM_THREADS"] = "1"
 os.environ["NUMEXPR_NUM_THREADS"] = "1"
 os.environ["VECLIB_MAXIMUM_THREADS"] = "1"
-MODEL_ID = "tiiuae/falcon-7b-instruct"
-print(f"Loading {MODEL_ID}... (This may take some time on first run)")
-tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
 model = AutoModelForCausalLM.from_pretrained(
-    MODEL_ID,
-    torch_dtype=torch.float32,
     device_map="auto"
 )
 # ===============================
 # Text Extraction (PDF/DOCX)
 # ===============================

 import json
 import torch
 from typing import List
 os.environ["OMP_NUM_THREADS"] = "1"
 os.environ["OPENBLAS_NUM_THREADS"] = "1"
 os.environ["NUMEXPR_NUM_THREADS"] = "1"
 os.environ["VECLIB_MAXIMUM_THREADS"] = "1"
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
+import torch
+bnb_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_compute_dtype=torch.float16,
+    bnb_4bit_use_double_quant=True,
+    bnb_4bit_quant_type="nf4"
+)
+tokenizer = AutoTokenizer.from_pretrained("tiiuae/falcon-7b-instruct")
 model = AutoModelForCausalLM.from_pretrained(
+    "tiiuae/falcon-7b-instruct",
+    quantization_config=bnb_config,
     device_map="auto"
 )
 # ===============================
 # Text Extraction (PDF/DOCX)
 # ===============================

requirements.txt CHANGED Viewed

@@ -61,4 +61,5 @@ requests>=2.31.0
 # Spaces.  The version is pinned for reproducibility and compatibility.
 psycopg2-binary
 matplotlib

 # Spaces.  The version is pinned for reproducibility and compatibility.
 psycopg2-binary
 matplotlib
+bitsandbytes>=0.41.0