Spaces:

david-thrower
/

3B-Param-Basic-Chatbot

Build error

david-thrower commited on 22 days ago

Commit

8c33b5c

verified ·

1 Parent(s): 4c1dfd9

Update app.py

1. Corrected model variable name
2. Added garbage collection after the quantization (Hoping it reduces RAM spend)

Files changed (1) hide show

app.py CHANGED Viewed

@@ -37,13 +37,13 @@ quantization_config = TorchAoConfig(quant_type=quant_config)
 MODEL_ID = "HuggingFaceTB/SmolLM3-3B"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
-quantized_model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     torch_dtype="auto",
     device_map="auto",
-    quantization_config=quantization_config
-)
 #########

 MODEL_ID = "HuggingFaceTB/SmolLM3-3B"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
+model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     torch_dtype="auto",
     device_map="auto",
+    quantization_config=quantization_config)
+gc.collect()
 #########