Spaces:

Ujeshhh
/

image-captioning

Sleeping

Ujeshhh commited on Apr 1

Commit

2747657

verified ·

1 Parent(s): 6a24fdd

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,8 +6,8 @@ import gradio as gr
 processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
 model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")
-# Load MarianMT model for translation (e.g., to Spanish)
-translation_model_name = "Helsinki-NLP/opus-mt-en-es"
 translator_model = MarianMTModel.from_pretrained(translation_model_name)
 translator_tokenizer = MarianTokenizer.from_pretrained(translation_model_name)
@@ -37,7 +37,7 @@ def generate_caption(image):
     out = model.generate(**inputs)
     caption = processor.decode(out[0], skip_special_tokens=True)
-    # Translate caption to local language (e.g., Spanish)
     translated = translator_tokenizer(caption, return_tensors="pt", padding=True)
     translated_text = translator_model.generate(**translated)
     translation = translator_tokenizer.decode(translated_text[0], skip_special_tokens=True)
@@ -48,7 +48,7 @@ def generate_caption(image):
 interface = gr.Interface(fn=generate_caption,
                          inputs=gr.Image(type="pil"),
                          outputs=[gr.Textbox(label="Caption in English"),
-                                  gr.Textbox(label="Caption in Local Language")])
 # Launch the Gradio app
 interface.launch()

 processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
 model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")
+# Load MarianMT model for translation (English to Tamil)
+translation_model_name = "Helsinki-NLP/opus-mt-en-ta"
 translator_model = MarianMTModel.from_pretrained(translation_model_name)
 translator_tokenizer = MarianTokenizer.from_pretrained(translation_model_name)
     out = model.generate(**inputs)
     caption = processor.decode(out[0], skip_special_tokens=True)
+    # Translate caption to Tamil
     translated = translator_tokenizer(caption, return_tensors="pt", padding=True)
     translated_text = translator_model.generate(**translated)
     translation = translator_tokenizer.decode(translated_text[0], skip_special_tokens=True)
 interface = gr.Interface(fn=generate_caption,
                          inputs=gr.Image(type="pil"),
                          outputs=[gr.Textbox(label="Caption in English"),
+                                  gr.Textbox(label="Caption in Tamil")])
 # Launch the Gradio app
 interface.launch()