Spaces:

Chanlefe
/

Thesis_CLIP

Sleeping

Chanlefe commited on Jun 7

Commit

131383f

verified ·

1 Parent(s): 07560ee

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,6 +2,23 @@ import torch
 from PIL import Image
 from transformers import AutoProcessor, AutoModelForImageClassification
 import gradio as gr
 # Load model and processor from Hugging Face
 model = AutoModelForImageClassification.from_pretrained("google/siglip2-base-patch16-naflex")

 from PIL import Image
 from transformers import AutoProcessor, AutoModelForImageClassification
 import gradio as gr
+import pytesseract
+def classify_meme(image: Image.Image):
+    # OCR: extract text from image
+    extracted_text = pytesseract.image_to_string(image)
+    # Process image with SigLIP2 model
+    inputs = processor(images=image, return_tensors="pt").to(model.device)
+    with torch.no_grad():
+        outputs = model(**inputs)
+        probs = torch.nn.functional.softmax(outputs.logits, dim=-1)
+    predictions = {labels[i]: float(probs[0][i]) for i in range(len(labels))}
+    return {
+        "Predictions": predictions,
+        "Extracted Text": extracted_text.strip()
+    }
 # Load model and processor from Hugging Face
 model = AutoModelForImageClassification.from_pretrained("google/siglip2-base-patch16-naflex")