Spaces:

feliksius
/

trans

Runtime error

App Files Files Community

feliksius commited on Jun 10

Commit

6e33f68

verified ·

1 Parent(s): 85186fc

Update app.py

Browse files

Files changed (1) hide show

app.py +42 -43

app.py CHANGED Viewed

@@ -1,70 +1,69 @@
-import gradio as gr
 from transformers import M2M100ForConditionalGeneration, M2M100Tokenizer
 import torch
-from langdetect import detect, LangDetectException
 # Load model dan tokenizer
 model_name = "facebook/m2m100_418M"
 try:
     tokenizer = M2M100Tokenizer.from_pretrained(model_name)
     model = M2M100ForConditionalGeneration.from_pretrained(model_name)
     device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
     model.to(device)
     model.eval()
 except Exception as e:
     raise Exception(f"Gagal memuat model: {str(e)}")
-# Fungsi terjemahan
-def translate_text(text, source_lang=None):
     try:
-        # Autodeteksi bahasa jika source_lang tidak diberikan
-        if not source_lang:
-            try:
-                detected_lang = detect(text)
-                if detected_lang not in tokenizer.supported_languages:
-                    return f"Bahasa terdeteksi '{detected_lang}' tidak didukung.", detected_lang
-                source_lang = detected_lang
-            except LangDetectException:
-                return "Gagal mendeteksi bahasa. Harap masukkan kode bahasa sumber.", None
-        else:
-            if source_lang not in tokenizer.supported_languages:
-                return f"Kode bahasa '{source_lang}' tidak didukung.", None
         # Set bahasa sumber
-        tokenizer.src_lang = source_lang
-        # Encode dan terjemahkan
-        encoded = tokenizer(text, return_tensors="pt", padding=True, truncation=True).to(device)
         generated_tokens = model.generate(
             **encoded,
             forced_bos_token_id=tokenizer.get_lang_id("en")
         )
         translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
-        return translated_text, source_lang
     except Exception as e:
-        return f"Error: {str(e)}", None
-# Buat antarmuka Gradio
-iface = gr.Interface(
-    fn=translate_text,
-    inputs=[
-        gr.Textbox(label="Teks untuk Diterjemahkan"),
-        gr.Dropdown(
-            choices=["id", "fr", "es", "de", "ja", ""],  # Tambahkan lebih banyak kode bahasa jika perlu
-            label="Bahasa Sumber (kosongkan untuk autodeteksi)",
-            value=""
-        )
-    ],
-    outputs=[
-        gr.Textbox(label="Terjemahan ke Bahasa Inggris"),
-        gr.Textbox(label="Bahasa Sumber Terdeteksi")
-    ],
-    title="M2M100 Translation to English",
-    description="Masukkan teks untuk diterjemahkan ke bahasa Inggris. Biarkan bahasa sumber kosong untuk autodeteksi."
-)
-# Luncurkan aplikasi
-if __name__ == "__main__":
-    iface.launch()

+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
 from transformers import M2M100ForConditionalGeneration, M2M100Tokenizer
 import torch
+# Inisialisasi FastAPI
+app = FastAPI(
+    title="M2M100 Translation API",
+    description="API untuk menerjemahkan teks dari berbagai bahasa ke bahasa Inggris menggunakan facebook/m2m100_418M.",
+    version="1.0.0"
+)
 # Load model dan tokenizer
 model_name = "facebook/m2m100_418M"
 try:
     tokenizer = M2M100Tokenizer.from_pretrained(model_name)
     model = M2M100ForConditionalGeneration.from_pretrained(model_name)
+    # Pindahkan model ke GPU jika tersedia
     device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
     model.to(device)
     model.eval()
 except Exception as e:
     raise Exception(f"Gagal memuat model: {str(e)}")
+# Definisikan request body
+class TranslationRequest(BaseModel):
+    text: str
+    source_lang: str  # Kode bahasa sumber, misalnya "id" untuk Indonesia, "fr" untuk Prancis
+# Definisikan response body
+class TranslationResponse(BaseModel):
+    translated_text: str
+@app.post("/translate", response_model=TranslationResponse)
+async def translate_text(request: TranslationRequest):
     try:
+        # Validasi kode bahasa
+        if request.source_lang not in tokenizer.supported_languages:
+            raise HTTPException(
+                status_code=400,
+                detail=f"Kode bahasa '{request.source_lang}' tidak didukung. Gunakan kode seperti 'id', 'fr', 'es', dll."
+            )
         # Set bahasa sumber
+        tokenizer.src_lang = request.source_lang
+        # Encode input teks
+        encoded = tokenizer(request.text, return_tensors="pt", padding=True, truncation=True).to(device)
+        # Generate terjemahan (target: English, "en")
         generated_tokens = model.generate(
             **encoded,
             forced_bos_token_id=tokenizer.get_lang_id("en")
         )
+        # Decode hasil terjemahan
         translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
+        return TranslationResponse(translated_text=translated_text)
     except Exception as e:
+        raise HTTPException(status_code=500, detail=f"Error saat menerjemahkan: {str(e)}")
+@app.get("/")
+async def root():
+    return {
+        "message": "Selamat datang di M2M100 Translation API! Gunakan endpoint /translate untuk menerjemahkan teks ke bahasa Inggris.",
+        "docs": "/docs"
+    }