dev-mode-orpheus-tts

Paused

Tomtom84 commited on Jun 9

Commit

931a5e2

verified ·

1 Parent(s): 1dac694

Update orpheus-tts/engine_class.py

Files changed (1) hide show

orpheus-tts/engine_class.py CHANGED Viewed

@@ -101,19 +101,24 @@ class OrpheusModel:
                 full_prompt = prompt
             # Kartoffel model token format - direkt die Token-IDs einfügen
-            start_token_id = 128259
-            end_token_ids = [128009, 128260]
             # Text tokenisieren
             input_ids = self.tokenizer(full_prompt, return_tensors="pt").input_ids[0].tolist()
             # Token-IDs zusammenfügen
             all_token_ids = [start_token_id] + input_ids + end_token_ids
-            # Zurück zu String dekodieren
-            prompt_string = self.tokenizer.decode(all_token_ids, skip_special_tokens=False)
-            return prompt_string
         else:
             # Original Orpheus format (für Canopy-Deutsch und English)
             if model_type == "smaller":

                 full_prompt = prompt
             # Kartoffel model token format - direkt die Token-IDs einfügen
+            # Basierend auf der Referenz-Implementierung
+            start_token_id = 128259  # Für Prompt-Start
+            end_token_ids = [128009, 128260]  # Für Prompt-Ende
             # Text tokenisieren
             input_ids = self.tokenizer(full_prompt, return_tensors="pt").input_ids[0].tolist()
+            print(f"DEBUG KARTOFFEL: input_ids: {input_ids}")
             # Token-IDs zusammenfügen
             all_token_ids = [start_token_id] + input_ids + end_token_ids
+            print(f"DEBUG KARTOFFEL: all_token_ids: {all_token_ids}")
+            # Für Kartoffel-Modell: Direkt die Token-IDs als String zurückgeben
+            # statt sie zu dekodieren, da das Modell numerische Token-IDs erwartet
+            token_string = " ".join(map(str, all_token_ids))
+            print(f"DEBUG KARTOFFEL: token_string: {token_string}")
+            return token_string
         else:
             # Original Orpheus format (für Canopy-Deutsch und English)
             if model_type == "smaller":