Spaces:

maitrix-org
/

Voila-demo

Running on Zero

guangyil commited on May 6

Commit

13efdd4

verified ·

1 Parent(s): 750f337

Update infer.py

Files changed (1) hide show

infer.py CHANGED Viewed

@@ -50,10 +50,10 @@ def load_model(model_name, audio_tokenizer_path):
         use_flash_attention_2=True,
         use_cache=True,
     )
-    model = model.to("cuda")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     tokenizer_voila = VoilaTokenizer(model_path=audio_tokenizer_path, device="cpu")
-    tokenizer_voila.to("cuda")
     return model, tokenizer, tokenizer_voila, model_type
 def is_audio_output_task(task_type):

         use_flash_attention_2=True,
         use_cache=True,
     )
+    # model = model.to("cuda")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     tokenizer_voila = VoilaTokenizer(model_path=audio_tokenizer_path, device="cpu")
+    # tokenizer_voila.to("cuda")
     return model, tokenizer, tokenizer_voila, model_type
 def is_audio_output_task(task_type):