Spaces:

Didier
/

Mistral_Small_AutoRound

Running on Zero

Didier commited on May 9

Commit

4fe7de8

verified ·

1 Parent(s): 6dd32b0

Update vlm.py

Files changed (1) hide show

vlm.py CHANGED Viewed

@@ -5,7 +5,8 @@ Author: Didier Guillevic
 Date: 2025-05-08
 """
-from transformers import AutoProcessor, AutoModelForImageTextToText
 import torch
 #
@@ -14,11 +15,11 @@ import torch
 model_id = "OPEA/Mistral-Small-3.1-24B-Instruct-2503-int4-AutoRound-awq-sym"
 device = 'cuda' if torch.cuda.is_available() else 'cpu'
 processor = AutoProcessor.from_pretrained(model_id)
-model = AutoModelForImageTextToText.from_pretrained(
     model_id,
     _attn_implementation="flash_attention_2",
     torch_dtype=torch.bfloat16
-).to(device)
 #
 # Encode images as base64

 Date: 2025-05-08
 """
+from transformers import AutoProcessor
+from transformers import Mistral3ForConditionalGeneration
 import torch
 #
 model_id = "OPEA/Mistral-Small-3.1-24B-Instruct-2503-int4-AutoRound-awq-sym"
 device = 'cuda' if torch.cuda.is_available() else 'cpu'
 processor = AutoProcessor.from_pretrained(model_id)
+model = Mistral3ForConditionalGeneration.from_pretrained(
     model_id,
     _attn_implementation="flash_attention_2",
     torch_dtype=torch.bfloat16
+).eval().to(device)
 #
 # Encode images as base64