Spaces:

hsuwill000
/

maxtest01

Running

hsuwill000 commited on Jul 2

Commit

5202755

verified ·

1 Parent(s): 678e02e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,7 +9,7 @@ import nncf
 import huggingface_hub as hf_hub
 # 初始化 OpenVINO 模型
 model_id = "Qwen/Qwen3-1.7B"
-optimized_model_path = "ov"
 '''
 import subprocess
@@ -38,13 +38,14 @@ hf_hub.snapshot_download(model_id, local_dir=model_path)
 model_path = "ov"
 pipe = ov_genai.LLMPipeline(model_path, "CPU")
 '''
 model = OVModelForCausalLM.from_pretrained(
-    model_path,
     quantization_config=OVWeightQuantizationConfig(bits=4, asym=True, ratio=0.8, dataset="ptb"),
 )
 # save the model after optimization
-model.save_pretrained(optimized_model_path)
 #pipe.start_chat()

 import huggingface_hub as hf_hub
 # 初始化 OpenVINO 模型
 model_id = "Qwen/Qwen3-1.7B"
+model_path = "ov"
 '''
 import subprocess
 model_path = "ov"
 pipe = ov_genai.LLMPipeline(model_path, "CPU")
 '''
 model = OVModelForCausalLM.from_pretrained(
+    model_id,
     quantization_config=OVWeightQuantizationConfig(bits=4, asym=True, ratio=0.8, dataset="ptb"),
 )
 # save the model after optimization
+model.save_pretrained(model_path)
 #pipe.start_chat()