Spaces:

david-thrower
/

3B-Param-Basic-Chatbot

Build error

david-thrower commited on 8 days ago

Commit

90f06c9

verified ·

1 Parent(s): 16b18f5

Update app.py

Revert attempt at 4 bit quantization. Not supported in TorchAO.

Files changed (1) hide show

app.py CHANGED Viewed

@@ -29,9 +29,9 @@ import gradio as gr
 import torch
 from transformers import TorchAoConfig, AutoModelForCausalLM, AutoTokenizer
-from torchao.quantization import Float8DynamicActivationFloat8WeightConfig, Float8WeightOnlyConfig, Float4DynamicActivationFloat4WeightConfig
 # quant_config = Float8WeightOnlyConfig()
-quant_config = Float4DynamicActivationFloat4WeightConfig() # Float8DynamicActivationFloat8WeightConfig()
 quantization_config = TorchAoConfig(quant_type=quant_config)
 MODEL_ID = "HuggingFaceTB/SmolLM3-3B"

 import torch
 from transformers import TorchAoConfig, AutoModelForCausalLM, AutoTokenizer
+from torchao.quantization import Float8DynamicActivationFloat8WeightConfig, Float8WeightOnlyConfig
 # quant_config = Float8WeightOnlyConfig()
+quant_config = Float8DynamicActivationFloat8WeightConfig()
 quantization_config = TorchAoConfig(quant_type=quant_config)
 MODEL_ID = "HuggingFaceTB/SmolLM3-3B"