FastAPIMT

Running

TiberiuCristianLeon commited on 28 days ago

Commit

fb22ed5

verified ·

1 Parent(s): e8cfbc3

Update src/translate/Translate.py

Files changed (1) hide show

src/translate/Translate.py CHANGED Viewed

@@ -53,17 +53,21 @@ def paraphraseTranslateMethod(requestValue: str, model: str):
     return " ".join(result_value).strip(), model
 def gemma(requestValue: str, model: str = 'Gargaz/gemma-2b-romanian-better'):
     prompt = f"Translate this to Romanian using a formal tone. Only return the translation: {requestValue}"
     messages = [{"role": "user", "content": f"Translate this text to Romanian using a formal tone. Only return the translated text: {requestValue}"}]
     if '/' not in model:
         model = 'Gargaz/gemma-2b-romanian-better'
     pipe = pipeline(
         "text-generation",
         model=model,
         device=-1,
-        max_new_tokens=256,          # Keep short to reduce verbosity
         do_sample=False            # Use greedy decoding for determinism
     )
     output = pipe(messages, num_return_sequences=1, return_full_text=False)
-    # return output[0]["generated_text"].strip(), model
-    return output, model

     return " ".join(result_value).strip(), model
 def gemma(requestValue: str, model: str = 'Gargaz/gemma-2b-romanian-better'):
+    requestValue = requestValue.replace('\n', ' ')
     prompt = f"Translate this to Romanian using a formal tone. Only return the translation: {requestValue}"
     messages = [{"role": "user", "content": f"Translate this text to Romanian using a formal tone. Only return the translated text: {requestValue}"}]
     if '/' not in model:
         model = 'Gargaz/gemma-2b-romanian-better'
+    max_new_tokens = len(requestValue) + len(requestValue) * 0.2
     pipe = pipeline(
         "text-generation",
         model=model,
         device=-1,
+        max_new_tokens=max_new_tokens,          # Keep short to reduce verbosity
         do_sample=False            # Use greedy decoding for determinism
     )
     output = pipe(messages, num_return_sequences=1, return_full_text=False)
+    generated_text = output[0]["generated_text"]
+    result = generated_text.split('\n', 1)[0].strip()
+    return result, model
+    # return output, model