dev-mode-orpheus-tts

Paused

Tomtom84 commited on Jun 9

Commit

66fc62a

verified ·

1 Parent(s): 601ab2c

Update orpheus-tts/engine_class.py

Files changed (1) hide show

orpheus-tts/engine_class.py CHANGED Viewed

@@ -78,7 +78,7 @@ class OrpheusModel:
             gpu_memory_utilization=0.85,
             max_model_len=8192,
             trust_remote_code=True,
-            enforce_eager=False,  # Disable CUDA graphs for better compatibility
             **self.engine_kwargs
         )
@@ -107,8 +107,9 @@ class OrpheusModel:
             # end_tokens = [128009, 128260]
             # Aber für Audio-Generierung brauchen wir auch das Audio-Start-Token!
             start_token = torch.tensor([[128259]], dtype=torch.int64)
-            end_tokens = torch.tensor([[128009, 128260, 128261, 128257]], dtype=torch.int64)  # 128257 ist CODE_START_TOKEN_ID
             input_ids = self.tokenizer(full_prompt, return_tensors="pt").input_ids
             print(f"DEBUG KARTOFFEL: Original prompt: '{full_prompt}'")

             gpu_memory_utilization=0.85,
             max_model_len=8192,
             trust_remote_code=True,
+            enforce_eager=True,  # Disable CUDA graphs for better compatibility
             **self.engine_kwargs
         )
             # end_tokens = [128009, 128260]
             # Aber für Audio-Generierung brauchen wir auch das Audio-Start-Token!
+            # Exakt wie in der Referenz-Implementierung
             start_token = torch.tensor([[128259]], dtype=torch.int64)
+            end_tokens = torch.tensor([[128009, 128260]], dtype=torch.int64)
             input_ids = self.tokenizer(full_prompt, return_tensors="pt").input_ids
             print(f"DEBUG KARTOFFEL: Original prompt: '{full_prompt}'")