FastAPIMT

Running

App Files Files Community

TiberiuCristianLeon commited on 30 days ago

Commit

d22cb09

verified ·

1 Parent(s): b8db721

Update src/translate/Translate.py

Browse files

Files changed (1) hide show

src/translate/Translate.py +30 -33

src/translate/Translate.py CHANGED Viewed

@@ -3,9 +3,9 @@ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 import torch
 import src.exception.Exception.Exception as ExceptionCustom
 METHOD = "TRANSLATE"
 tokenizerROMENG = AutoTokenizer.from_pretrained("BlackKakapo/opus-mt-ro-en")
 modelROMENG = AutoModelForSeq2SeqLM.from_pretrained("BlackKakapo/opus-mt-ro-en")
@@ -16,40 +16,37 @@ device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 modelROMENG.to(device)
 modelENGROM.to(device)
-def paraphraseTranslateMethod(requestValue : str, model: str):
-	exception = ""
-	result_value = ""
-	exception = ExceptionCustom.checkForException(requestValue, METHOD)
-	if exception != "":
-		return "", exception
-	tokenized_sent_list = sent_tokenize(requestValue)
-	for SENTENCE in tokenized_sent_list:
         if model == 'roen':
             input_ids = tokenizerROMENG(SENTENCE, return_tensors='pt').to(device)
-    		output = modelROMENG.generate(
-    	        input_ids=input_ids1.input_ids,
-    	        do_sample=True,
-    	        max_length=512,
-    	        top_k=90,
-    	        top_p=0.97,
-    	        early_stopping=False
-    	    )
-    		result = tokenizerROMENG.batch_decode(output1, skip_special_tokens=True)[0]
         else:
-    		input_ids = tokenizerENGROM(SENTENCE, return_tensors='pt').to(device)
-    		output = modelENGROM.generate(
-    			input_ids=input_ids.input_ids,
-    			do_sample=True,
-    			max_length=512,
-    			top_k=90,
-    			top_p=0.97,
-    			early_stopping=False
-    		)
-		result = tokenizerENGROM.batch_decode(output, skip_special_tokens=True)[0]
-	return result.strip(), model

 import torch
 import src.exception.Exception.Exception as ExceptionCustom
 METHOD = "TRANSLATE"
+# Load models and tokenizers
 tokenizerROMENG = AutoTokenizer.from_pretrained("BlackKakapo/opus-mt-ro-en")
 modelROMENG = AutoModelForSeq2SeqLM.from_pretrained("BlackKakapo/opus-mt-ro-en")
 modelROMENG.to(device)
 modelENGROM.to(device)
+def paraphraseTranslateMethod(requestValue: str, model: str):
+    exception = ExceptionCustom.checkForException(requestValue, METHOD)
+    if exception:
+        return "", exception
+    tokenized_sent_list = sent_tokenize(requestValue)
+    result_value = []
+    for SENTENCE in tokenized_sent_list:
         if model == 'roen':
             input_ids = tokenizerROMENG(SENTENCE, return_tensors='pt').to(device)
+            output = modelROMENG.generate(
+                input_ids=input_ids.input_ids,
+                do_sample=True,
+                max_length=512,
+                top_k=90,
+                top_p=0.97,
+                early_stopping=False
+            )
+            result = tokenizerROMENG.batch_decode(output, skip_special_tokens=True)[0]
         else:
+            input_ids = tokenizerENGROM(SENTENCE, return_tensors='pt').to(device)
+            output = modelENGROM.generate(
+                input_ids=input_ids.input_ids,
+                do_sample=True,
+                max_length=512,
+                top_k=90,
+                top_p=0.97,
+                early_stopping=False
+            )
+            result = tokenizerENGROM.batch_decode(output, skip_special_tokens=True)[0]
+        result_value.append(result)
+    return " ".join(result_value).strip(), model