Spaces:

bobpopboom
/

testing

Sleeping

bobpopboom commited on Feb 9

Commit

fd1d420

verified ·

1 Parent(s): 3f3da62

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,16 +1,18 @@
 import gradio as gr
-from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer
 import torch
 model_id = "thrishala/mental_health_chatbot"
 try:
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     model = AutoModelForCausalLM.from_pretrained(
         model_id,
-        load_in_8bit=True,  # Load in 8-bit quantization
         device_map="auto", #Use GPU if available
-        torch_dtype=torch.float16 #Use float 16 for additional memory reduction
     )
     pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)

 import gradio as gr
+from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 import torch
 model_id = "thrishala/mental_health_chatbot"
 try:
+    quantization_config = BitsAndBytesConfig(
+        load_in_4bit=True,  # we going to 4 babey
+    )
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     model = AutoModelForCausalLM.from_pretrained(
         model_id,
+        quantization_config=quantization_config,
         device_map="auto", #Use GPU if available
     )
     pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)