Spaces:

DHEIVER
/

blip-image-captioning-base

Sleeping

App Files Files Community

DHEIVER commited on Feb 5

Commit

e6a5fa4

verified ·

1 Parent(s): ef7a048

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -10

app.py CHANGED Viewed

@@ -1,23 +1,23 @@
 import gradio as gr
-from transformers import BlipProcessor, BlipForConditionalGeneration, pipeline
 from PIL import Image
 import requests
-# Carregar o modelo BLIP para geração de descrições de imagens
-processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
-model_blip = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")
-# Carregar um modelo de linguagem para análise nutricional (exemplo: GPT-Neo)
-nutrition_model = pipeline("text-generation", model="EleutherAI/gpt-neo-125M")
 def interpret_image(image):
     # Converter a imagem para o formato PIL se necessário
     if isinstance(image, str):
         image = Image.open(requests.get(image, stream=True).raw)
-    # Processar a imagem e gerar a descrição
     inputs = processor(image, return_tensors="pt")
-    out = model_blip.generate(**inputs)
     # Decodificar a saída para texto
     description = processor.decode(out[0], skip_special_tokens=True)
@@ -25,7 +25,7 @@ def interpret_image(image):
     return description
 def nutritional_analysis(image):
-    # Passo 1: Gerar descrição da imagem usando BLIP
     description = interpret_image(image)
     # Passo 2: Criar um prompt para análise nutricional
@@ -38,7 +38,7 @@ def nutritional_analysis(image):
     )
     # Passo 3: Usar o modelo de linguagem para gerar a análise nutricional
-    analysis = nutrition_model(prompt, max_length=300, num_return_sequences=1)[0]['generated_text']
     # Retornar a descrição e a análise nutricional
     return description, analysis

 import gradio as gr
+from transformers import Blip2Processor, Blip2ForConditionalGeneration, pipeline
 from PIL import Image
 import requests
+# Carregar o modelo BLIP-2 para geração de descrições de imagens
+processor = Blip2Processor.from_pretrained("Salesforce/blip2-opt-2.7b")
+model_blip2 = Blip2ForConditionalGeneration.from_pretrained("Salesforce/blip2-opt-2.7b")
+# Carregar um modelo de linguagem para análise nutricional (exemplo: Flan-T5)
+nutrition_model = pipeline("text2text-generation", model="google/flan-t5-large")
 def interpret_image(image):
     # Converter a imagem para o formato PIL se necessário
     if isinstance(image, str):
         image = Image.open(requests.get(image, stream=True).raw)
+    # Processar a imagem e gerar a descrição usando BLIP-2
     inputs = processor(image, return_tensors="pt")
+    out = model_blip2.generate(**inputs)
     # Decodificar a saída para texto
     description = processor.decode(out[0], skip_special_tokens=True)
     return description
 def nutritional_analysis(image):
+    # Passo 1: Gerar descrição da imagem usando BLIP-2
     description = interpret_image(image)
     # Passo 2: Criar um prompt para análise nutricional
     )
     # Passo 3: Usar o modelo de linguagem para gerar a análise nutricional
+    analysis = nutrition_model(prompt, max_length=300)[0]['generated_text']
     # Retornar a descrição e a análise nutricional
     return description, analysis