dev-mode-orpheus-tts

Paused

Tomtom84 commited on Jun 9

Commit

e43b774

verified ·

1 Parent(s): f954241

Update orpheus-tts/engine_class.py

Files changed (1) hide show

orpheus-tts/engine_class.py CHANGED Viewed

@@ -100,25 +100,26 @@ class OrpheusModel:
             else:
                 full_prompt = prompt
-            # Kartoffel model token format - direkt die Token-IDs einfügen
-            # Basierend auf der Referenz-Implementierung
-            start_token_id = 128259  # Für Prompt-Start
-            end_token_ids = [128009, 128260]  # Für Prompt-Ende
-            # Text tokenisieren
-            input_ids = self.tokenizer(full_prompt, return_tensors="pt").input_ids[0].tolist()
-            print(f"DEBUG KARTOFFEL: input_ids: {input_ids}")
             # Token-IDs zusammenfügen
-            all_token_ids = [start_token_id] + input_ids + end_token_ids
-            print(f"DEBUG KARTOFFEL: all_token_ids: {all_token_ids}")
-            # Für Kartoffel-Modell: Direkt die Token-IDs als String zurückgeben
-            # statt sie zu dekodieren, da das Modell numerische Token-IDs erwartet
-            token_string = " ".join(map(str, all_token_ids))
-            print(f"DEBUG KARTOFFEL: token_string: {token_string}")
-            return token_string
         else:
             # Original Orpheus format (für Canopy-Deutsch und English)
             if model_type == "smaller":

             else:
                 full_prompt = prompt
+            # Kartoffel model format - exakt wie in der Referenz-Implementierung
+            import torch
+            start_token = torch.tensor([[128259]], dtype=torch.int64)
+            end_tokens = torch.tensor([[128009, 128260]], dtype=torch.int64)
+            input_ids = self.tokenizer(full_prompt, return_tensors="pt").input_ids
+            print(f"DEBUG KARTOFFEL: Original prompt: '{full_prompt}'")
+            print(f"DEBUG KARTOFFEL: input_ids shape: {input_ids.shape}")
             # Token-IDs zusammenfügen
+            modified_input_ids = torch.cat([start_token, input_ids, end_tokens], dim=1)
+            print(f"DEBUG KARTOFFEL: modified_input_ids shape: {modified_input_ids.shape}")
+            print(f"DEBUG KARTOFFEL: modified_input_ids: {modified_input_ids[0].tolist()}")
+            # Zurück zu Text dekodieren - EXAKT wie in der Referenz
+            decoded_text = self.tokenizer.decode(modified_input_ids[0], skip_special_tokens=False)
+            print(f"DEBUG KARTOFFEL: Final decoded prompt: '{decoded_text}'")
+            return decoded_text
         else:
             # Original Orpheus format (für Canopy-Deutsch und English)
             if model_type == "smaller":