Gemini-Edit-Image

Running

App Files Files Community

DHEIVER commited on Mar 21

Commit

68c4f35

verified ·

1 Parent(s): 88c1eca

Update app.py

Browse files

Files changed (1) hide show

app.py +42 -82

app.py CHANGED Viewed

@@ -1,13 +1,7 @@
-import json
 import os
-import time
-import uuid
 import tempfile
-from PIL import Image, ImageDraw, ImageFont
 import gradio as gr
-import base64
-import mimetypes
 from google import genai
 from google.genai import types
@@ -17,7 +11,6 @@ def save_binary_file(file_name, data):
 def generate(text, file_name, api_key, model="gemini-2.0-flash-exp"):
     client = genai.Client(api_key=(api_key.strip() if api_key and api_key.strip() != "" else os.environ.get("GEMINI_API_KEY")))
     files = [client.files.upload(file=file_name)]
     contents = [
@@ -48,7 +41,6 @@ def generate(text, file_name, api_key, model="gemini-2.0-flash-exp"):
             candidate = chunk.candidates[0].content.parts[0]
             if candidate.inline_data:
                 save_binary_file(temp_path, candidate.inline_data.data)
-                print(f"Arquivo de tipo {candidate.inline_data.mime_type} salvo em: {temp_path} com prompt: {text}")
                 image_path = temp_path
                 break
             else:
@@ -60,11 +52,11 @@ def generate(text, file_name, api_key, model="gemini-2.0-flash-exp"):
 def process_image_and_prompt(composite_pil, prompt, gemini_api_key):
     try:
         if not composite_pil:
-            raise gr.Error("Por favor, carregue uma imagem antes de gerar.", duration=5)
         if not prompt:
-            raise gr.Error("Por favor, insira um prompt antes de gerar.", duration=5)
         if not gemini_api_key and not os.environ.get("GEMINI_API_KEY"):
-            raise gr.Error("Por favor, forneça uma chave API Gemini ou configure a variável de ambiente GEMINI_API_KEY.", duration=10)
         with tempfile.NamedTemporaryFile(suffix=".png", delete=False) as tmp:
             composite_path = tmp.name
@@ -76,94 +68,62 @@ def process_image_and_prompt(composite_pil, prompt, gemini_api_key):
             result_img = Image.open(image_path)
             if result_img.mode == "RGBA":
                 result_img = result_img.convert("RGB")
-            return [result_img], ""
         else:
             return None, text_response
     except Exception as e:
-        raise gr.Error(f"Erro ao processar: {e}", duration=5)
-# Interface com Gradio
-with gr.Blocks(css="style.css", title="Gemini para Edição de Imagens") as demo:
     gr.HTML(
     """
-    <div class="header-container">
-        <div class="logo">
-            <img src="https://www.gstatic.com/lamda/images/gemini_favicon_f069958c85030456e93de685481c559f160ea06b.png" alt="Logo Gemini">
-        </div>
-        <div class="header-text">
-            <h1>✨ Gemini para Edição de Imagens ✨</h1>
-            <p>Desenvolvido com <a href="https://gradio.app/">Gradio</a> ⚡️ |
-            <a href="https://huggingface.co/spaces/ameerazam08/Gemini-Image-Edit?duplicate=true">Duplique este Repositório</a> |
-            <a href="https://aistudio.google.com/apikey">Obtenha uma Chave API</a> |
-            Siga-me no LinkedIn: <a href="https://www.linkedin.com/in/dheiver-santos/">dheiver-santos</a></p>
-        </div>
     </div>
     """
     )
-    with gr.Tabs():
-        with gr.TabItem("Editar Imagem"):
             with gr.Row():
-                with gr.Column(scale=1, min_width=300):
-                    gr.Markdown("### 📤 Entrada")
-                    image_input = gr.Image(type="pil", label="Carregar Imagem (PNG)", image_mode="RGBA", elem_classes="upload-box")
-                    gemini_api_key = gr.Textbox(lines=1, placeholder="Insira a Chave API Gemini", label="Chave API Gemini",
-                                               elem_classes="api-key-input", type="password")
-                    prompt_input = gr.Textbox(lines=3, placeholder="Digite seu prompt aqui...", label="Prompt de Edição",
-                                             elem_classes="prompt-input")
-                    with gr.Row():
-                        submit_btn = gr.Button("Gerar Imagem", variant="primary", elem_classes="generate-btn")
-                        clear_btn = gr.Button("Limpar", variant="secondary")
-                with gr.Column(scale=2, min_width=400):
-                    gr.Markdown("### 📷 Resultado")
-                    output_gallery = gr.Gallery(label="Imagem Gerada", elem_classes="output-gallery", preview=True)
-                    output_text = gr.Textbox(label="Saída de Texto (se aplicável)", placeholder="Se nenhuma imagem for gerada, o texto aparecerá aqui.",
-                                            elem_classes="output-text", interactive=False)
-        with gr.TabItem("Instruções e Configuração"):
-            with gr.Row():
-                with gr.Column():
-                    with gr.Accordion("⚠️ Configuração da API", open=False, elem_classes="config-accordion"):
-                        gr.Markdown("""
-                        - **Problema:** ❗ Às vezes, o modelo retorna texto em vez de uma imagem.
-                        ### 🔧 Solução:
-                        1. **🛠️ Duplique o Repositório**
-                           - Crie uma cópia separada para modificações.
-                        2. **🔑 Use Sua Própria Chave API Gemini**
-                           - É **obrigatório** configurar sua chave Gemini para geração!
-                        3. **🌐 Verifique sua conexão**
-                           - Certifique-se de que a API está acessível.
-                        """)
-                with gr.Column():
-                    with gr.Accordion("📌 Instruções de Uso", open=False, elem_classes="instructions-accordion"):
-                        gr.Markdown("""
-                        ### 📌 Como Usar
-                        - Faça upload de uma imagem PNG no campo à esquerda.
-                        - Insira um prompt em inglês descrevendo a edição desejada.
-                        - Clique em "Gerar Imagem" para processar.
-                        - Veja o resultado na galeria ou texto abaixo.
-                        - **Dica:** Use prompts claros como "add lipstick on lips" ou "remove the spoon".
-                        - ❌ **Não use imagens NSFW!**
-                        """)
-    gr.Markdown("### 🎨 Exemplos Práticos", elem_classes="gr-examples-header")
     examples = [
         ["data/1.webp", "change text to 'AMEER'", ""],
         ["data/2.webp", "remove the spoon from hand only", ""],
         ["data/3.webp", "change text to 'Make it'", ""],
-        ["data/1.jpg", "add joker style only on face", ""],
-        ["data/1777043.jpg", "add joker style only on face", ""],
-        ["data/2807615.jpg", "add lipstick on lip only", ""],
-        ["data/76860.jpg", "add lipstick on lip only", ""],
-        ["data/2807615.jpg", "make it happy looking face only", ""],
     ]
-    gr.Examples(examples=examples, inputs=[image_input, prompt_input, gemini_api_key], outputs=[output_gallery, output_text],
-                fn=process_image_and_prompt, cache_examples=False, elem_id="examples-grid")
     # Eventos
-    submit_btn.click(fn=process_image_and_prompt, inputs=[image_input, prompt_input, gemini_api_key],
-                     outputs=[output_gallery, output_text])
-    clear_btn.click(fn=lambda: (None, "", "", None, ""), inputs=[], outputs=[image_input, prompt_input, gemini_api_key, output_gallery, output_text])
 demo.queue(max_size=50).launch()

 import os
 import tempfile
+from PIL import Image
 import gradio as gr
 from google import genai
 from google.genai import types
 def generate(text, file_name, api_key, model="gemini-2.0-flash-exp"):
     client = genai.Client(api_key=(api_key.strip() if api_key and api_key.strip() != "" else os.environ.get("GEMINI_API_KEY")))
     files = [client.files.upload(file=file_name)]
     contents = [
             candidate = chunk.candidates[0].content.parts[0]
             if candidate.inline_data:
                 save_binary_file(temp_path, candidate.inline_data.data)
                 image_path = temp_path
                 break
             else:
 def process_image_and_prompt(composite_pil, prompt, gemini_api_key):
     try:
         if not composite_pil:
+            raise gr.Error("Carregue uma imagem primeiro.", duration=5)
         if not prompt:
+            raise gr.Error("Digite um prompt antes de gerar.", duration=5)
         if not gemini_api_key and not os.environ.get("GEMINI_API_KEY"):
+            raise gr.Error("Insira uma chave API Gemini ou configure a variável GEMINI_API_KEY.", duration=10)
         with tempfile.NamedTemporaryFile(suffix=".png", delete=False) as tmp:
             composite_path = tmp.name
             result_img = Image.open(image_path)
             if result_img.mode == "RGBA":
                 result_img = result_img.convert("RGB")
+            return result_img, ""
         else:
             return None, text_response
     except Exception as e:
+        raise gr.Error(f"Erro: {e}", duration=5)
+# Interface Moderna
+with gr.Blocks(css="style.css", theme=gr.themes.Soft(), title="Gemini Image Editor") as demo:
     gr.HTML(
     """
+    <div class="header">
+        <img src="https://www.gstatic.com/lamda/images/gemini_favicon_f069958c85030456e93de685481c559f160ea06b.png" alt="Logo" class="logo">
+        <h1>Gemini Image Editor</h1>
+        <p class="subtitle">Edite imagens com IA de forma simples e poderosa</p>
     </div>
     """
     )
+    with gr.Row(elem_classes="main-container"):
+        with gr.Column(scale=1, elem_classes="input-section"):
+            image_input = gr.Image(type="pil", label="Carregar Imagem (PNG)", elem_classes="image-upload")
+            prompt_input = gr.Textbox(placeholder="Digite o prompt (ex: 'add a hat')", label="Prompt", elem_classes="prompt-box")
+            gemini_api_key = gr.Textbox(placeholder="Chave API Gemini", label="API Key", type="password", elem_classes="api-key-box")
             with gr.Row():
+                submit_btn = gr.Button("Gerar", variant="primary", elem_classes="submit-btn")
+                clear_btn = gr.Button("Limpar", variant="secondary", elem_classes="clear-btn")
+        with gr.Column(scale=2, elem_classes="output-section"):
+            output_image = gr.Image(label="Resultado", elem_classes="output-image")
+            output_text = gr.Textbox(label="Mensagem", placeholder="Resultados de texto aparecem aqui", interactive=False, elem_classes="output-text")
+    with gr.Accordion("ℹ️ Como Usar e Configurar", open=False, elem_classes="info-accordion"):
+        gr.Markdown("""
+        ### Como Usar
+        1. Faça upload de uma imagem PNG.
+        2. Digite um prompt em inglês (ex: "remove the background").
+        3. Insira sua chave API Gemini ou configure a variável `GEMINI_API_KEY`.
+        4. Clique em "Gerar" e veja o resultado!
+        ### Configuração
+        - Obtenha sua chave API em <a href="https://aistudio.google.com/apikey">Google AI Studio</a>.
+        - Duplique este projeto em <a href="https://huggingface.co/spaces/ameerazam08/Gemini-Image-Edit?duplicate=true">Hugging Face</a>.
+        - Contato: <a href="https://www.linkedin.com/in/dheiver-santos/">Dheiver Santos</a>.
+        """)
+    gr.Markdown("### Exemplos", elem_classes="examples-header")
     examples = [
         ["data/1.webp", "change text to 'AMEER'", ""],
         ["data/2.webp", "remove the spoon from hand only", ""],
         ["data/3.webp", "change text to 'Make it'", ""],
     ]
+    gr.Examples(examples=examples, inputs=[image_input, prompt_input, gemini_api_key], outputs=[output_image, output_text],
+                fn=process_image_and_prompt, cache_examples=False)
     # Eventos
+    submit_btn.click(fn=process_image_and_prompt, inputs=[image_input, prompt_input, gemini_api_key], outputs=[output_image, output_text])
+    clear_btn.click(fn=lambda: (None, "", "", None, ""), inputs=[], outputs=[image_input, prompt_input, gemini_api_key, output_image, output_text])
 demo.queue(max_size=50).launch()