Spaces:

Manireddy1508
/

imagetoimage

Paused

File size: 4,247 Bytes

fdd3761
 
8124057
 
c1ad0ba
37abfc2
2736052
 
ec84a8b
 
bb3cc4e
38d816c
37abfc2
 
 
ec84a8b
 
37abfc2
 
ec84a8b
37abfc2
2736052
ec84a8b
2736052
 
 
ec84a8b
6e52c0e
2736052
e9eb7f3
4895c45
37abfc2
a218b7f
ec84a8b
a218b7f
2736052
 
6e52c0e
 
ec84a8b
4f9120d
2736052
6e52c0e
 
ec84a8b
 
 
 
6e52c0e
0a10f4f
37abfc2
 
 
a218b7f
d3a3bf1
 
ec84a8b
6e52c0e
 
 
ec84a8b
129d6d6
 
d3a3bf1
ec84a8b
bb3cc4e
129d6d6
 
 
 
ec84a8b
c6e6083
2736052
d3a3bf1
52b4e6d
129d6d6
ec84a8b
c67583f
 
 
 
ec84a8b
e9eb7f3
c67583f
 
 
 
ec84a8b
 
c67583f
37abfc2
129d6d6
38d816c
d3a3bf1
52b4e6d
2736052
8124057
37abfc2
52b4e6d
37abfc2
8124057
ec84a8b
38d816c
8124057
38d816c
37abfc2
38d816c
fdd3761
38d816c
8124057
38d816c
e9eb7f3
37abfc2
2736052
38d816c
 
 
a218b7f
2736052
38d816c
8124057
37abfc2
38d816c

# app.py

import gradio as gr
from PIL import Image
import os
import torch
import numpy as np
import cv2

from diffusers import StableDiffusionXLControlNetPipeline, ControlNetModel
from utils.planner import extract_scene_plan, generate_prompt_variations_from_scene  # 🧠 Brain Layer

# ----------------------------
# 🔧 Device Setup
# ----------------------------
device = "cpu"  # ✅ Using CPU for now
dtype = torch.float32

# ----------------------------
# ✅ Load ControlNet + SDXL Model (Corrected)
# ----------------------------
controlnet = ControlNetModel.from_pretrained(
    "diffusers/controlnet-canny-sdxl-1.0",  # Use official Canny + SDXL ControlNet model
    torch_dtype=dtype
)

pipe = StableDiffusionXLControlNetPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet=controlnet,
    torch_dtype=dtype
).to(device)

# ----------------------------
# 🔍 Canny Edge Generator
# ----------------------------
def generate_canny_map(image: Image.Image) -> Image.Image:
    print("🔍 Generating Canny map...")
    if image is None:
        raise ValueError("🚫 No image passed to Canny generator")

    image = image.resize((1024, 1024)).convert("RGB")
    np_image = np.array(image)
    gray = cv2.cvtColor(np_image, cv2.COLOR_RGB2GRAY)
    edges = cv2.Canny(gray, 100, 200)

    if edges is None:
        raise ValueError("🚫 OpenCV Canny failed to produce edge map")

    return Image.fromarray(edges).convert("RGB")

# ----------------------------
# 🎨 Image Generation Function
# ----------------------------
def process_image(prompt, image, num_variations):
    try:
        print("🧠 Prompt received:", prompt)

        if image is None:
            raise ValueError("🚫 Uploaded image is missing or invalid.")

        # Step 1: Extract scene plan
        scene_plan = extract_scene_plan(prompt)
        print("🧠 Scene plan extracted:", scene_plan)

        # Step 2: Generate enriched prompt variations
        prompt_list = generate_prompt_variations_from_scene(scene_plan, prompt, num_variations)
        print("🧠 Enriched Prompts:")
        for i, p in enumerate(prompt_list):
            print(f"  {i+1}: {p}")

        # Step 3: Prepare image and Canny edge
        image = image.resize((1024, 1024)).convert("RGB")
        canny_map = generate_canny_map(image)

        outputs = []
        for i, enriched_prompt in enumerate(prompt_list):
            print(f"🎨 Generating image {i+1}...")
            try:
                result = pipe(
                    prompt=enriched_prompt,
                    image=image,
                    control_image=canny_map,
                    num_inference_steps=30,
                    strength=0.5,
                    guidance_scale=7.5
                )
                outputs.append(result.images[0])
            except Exception as err:
                print(f"❌ Failed to generate image {i+1}:", err)
                outputs.append(Image.new("RGB", (512, 512), color="red"))

        return outputs, scene_plan, canny_map

    except Exception as e:
        print("❌ Generation failed:", e)
        return ["❌ Error during generation"], {"error": str(e)}, None

# ----------------------------
# 🖼 Gradio UI
# ----------------------------
with gr.Blocks() as demo:
    gr.Markdown("## 🧠 NewCrux AI — SDXL + Canny (CPU Mode)\nUpload a product image, enter a prompt, and generate enhanced visuals using ControlNet.")

    with gr.Row():
        with gr.Column():
            prompt_input = gr.Textbox(label="Prompt")
            image_input = gr.Image(type="pil", label="Upload Product Image")
            variation_slider = gr.Slider(1, 4, step=1, value=1, label="Number of Variations")
            generate_btn = gr.Button("Generate")

        with gr.Column():
            output_gallery = gr.Gallery(label="Generated Variations", columns=2, rows=2, height="auto")
            json_output = gr.JSON(label="🧠 Brain Layer Reasoning")
            canny_preview = gr.Image(label="🔍 Canny Edge Preview")

    generate_btn.click(
        fn=process_image,
        inputs=[prompt_input, image_input, variation_slider],
        outputs=[output_gallery, json_output, canny_preview]
    )

demo.launch()