Spaces:

hsuwill000
/

maxtest01

Running

hsuwill000 commited on Jul 2

Commit

edd5af4

verified ·

1 Parent(s): 23052cd

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -32,8 +32,7 @@ model_path = "ov"
 '''
 hf_hub.snapshot_download(model_id, local_dir=model_path)
 '''
-model_path = "ov"
-pipe = ov_genai.LLMPipeline(model_path, "CPU")
 config = ov_genai.GenerationConfig()
 config.max_new_tokens = 4096
@@ -41,7 +40,7 @@ config.top_p = 0.9;
 config.top_k = 30;
-pipe = OVModelForCausalLM.from_pretrained(
     model_id,
     export=True,
     quantization_config=OVWeightQuantizationConfig(bits=4),
@@ -49,7 +48,10 @@ pipe = OVModelForCausalLM.from_pretrained(
 # save the model after optimization
-#pipe.save_pretrained(model_path)
 #pipe.start_chat()

 '''
 hf_hub.snapshot_download(model_id, local_dir=model_path)
 '''
 config = ov_genai.GenerationConfig()
 config.max_new_tokens = 4096
 config.top_k = 30;
+model = OVModelForCausalLM.from_pretrained(
     model_id,
     export=True,
     quantization_config=OVWeightQuantizationConfig(bits=4),
 # save the model after optimization
+model.save_pretrained(model_path)
+pipe = ov_genai.LLMPipeline(model_path, "CPU")
 #pipe.start_chat()