Spaces:
Sleeping
Sleeping
import gradio as gr | |
# requests jest nadal w requirements.txt, ale nie jest już bezpośrednio używany do głównego wywołania API | |
import requests | |
from PIL import Image, ImageOps | |
import io | |
import os | |
import traceback | |
# Poprawny import dla gradio_client | |
from gradio_client import Client, file | |
import uuid | |
import shutil | |
print("--- Plik app.py - Start ładowania ---") | |
# --- Konfiguracja --- | |
# Odczytanie sekretu (API Token) ustawionego w Space | |
API_TOKEN = os.getenv("HUGGINGFACE_API_TOKEN") | |
# Sprawdzenie, czy token został załadowany | |
if not API_TOKEN: | |
# Nadal ostrzegamy, ale klient może działać anonimowo | |
print("!!! OSTRZEŻENIE: Nie znaleziono sekretu HUGGINGFACE_API_TOKEN. Klient Gradio spróbuje połączyć się anonimowo (mogą obowiązywać limity). !!!") | |
else: | |
print("--- Sekret HUGGINGFACE_API_TOKEN załadowany. ---") | |
# Profesjonalny prompt, który chcemy uzyskać | |
LINKEDIN_PROMPT = ( | |
"linkedin professional profile photo, corporate headshot, high quality, realistic photograph, " | |
"person wearing a dark business suit or elegant blouse, plain white background, " # Usunięto potencjalnie problematyczne tagi | |
"soft studio lighting, sharp focus, looking at camera, slight smile, natural skin texture" | |
) | |
# Adres publicznego Space'a z InstantID | |
# Używamy identyfikatora Space'a dla gradio_client | |
TARGET_SPACE_ID = "InstantX/InstantID" | |
# Kontrolny print, aby sprawdzić, czy zmienna jest ładowana na starcie | |
# Powinien pojawić się w logach kontenera po restarcie Space'a | |
print(f"--- Konfiguracja załadowana. Cel dla gradio_client: {TARGET_SPACE_ID} ---") | |
# --- Logika aplikacji --- | |
def generate_photo(input_selfie, current_prompt): | |
print(f"Otrzymano obrazek typu: {type(input_selfie)}, Oryginalny rozmiar: {input_selfie.size}") | |
print(f"Otrzymano prompt (początek): {current_prompt[:100]}...") | |
# --- Dodany Krok: Przeskalowanie obrazka wejściowego --- | |
try: | |
max_size = (1024, 1024) # Maksymalny rozmiar (szerokość, wysokość) | |
# Używamy thumbnail, aby zachować proporcje i zmniejszyć tylko jeśli jest większy | |
input_selfie_resized = input_selfie.copy() # Pracuj na kopii | |
input_selfie_resized.thumbnail(max_size, Image.Resampling.LANCZOS) | |
print(f"Obrazek przeskalowany do (maksymalnie) {max_size}. Nowy rozmiar: {input_selfie_resized.size}") | |
except Exception as e_resize: | |
print(f"BŁĄD podczas skalowania obrazka: {e_resize}") | |
traceback.print_exc() | |
raise gr.Error(f"Nie można przeskalować obrazka wejściowego: {e_resize}") | |
# --------------------------------------------------------- | |
# 2. Przygotowanie pliku tymczasowego dla obrazka wejściowego | |
# (Używamy teraz przeskalowanego obrazka: input_selfie_resized) | |
temp_dir = f"temp_input_{uuid.uuid4()}" | |
input_image_path = None | |
try: | |
os.makedirs(temp_dir, exist_ok=True) | |
input_image_path = os.path.join(temp_dir, "input_selfie.jpg") | |
# Upewnijmy się, że obraz jest w RGB przed zapisem jako JPEG | |
rgb_image = input_selfie_resized # Używamy przeskalowanego! | |
if rgb_image.mode == 'RGBA': | |
print("Konwertuję przeskalowany obraz RGBA na RGB z białym tłem...") | |
# Stwórz nowy obraz RGB wypełniony białym kolorem | |
final_image = Image.new("RGB", rgb_image.size, (255, 255, 255)) | |
# Wklej oryginalny obraz używając jego kanału alfa jako maski | |
final_image.paste(rgb_image, mask=rgb_image.split()[3]) | |
else: | |
final_image = rgb_image # Już jest w odpowiednim trybie | |
# Zapisz przeskalowany i skonwertowany obraz jako JPEG | |
final_image.save(input_image_path, format="JPEG") | |
print(f"Przeskalowany obrazek wejściowy zapisany tymczasowo w: {input_image_path}") | |
except Exception as e: | |
# ... (reszta obsługi błędu zapisu bez zmian) ... | |
# 3. Wywołanie zdalnego API Gradio za pomocą gradio_client | |
# ... (reszta kodu bez zmian, aż do obsługi błędu AppError) ... | |
except Exception as e: | |
print(f"BŁĄD podczas komunikacji z klientem Gradio lub przetwarzania wyniku: {e}") | |
traceback.print_exc() | |
# Dodajmy podpowiedź o możliwej przyczynie błędu AppError | |
error_message = f"Problem podczas generowania przez zdalny serwis InstantID: {e}" | |
if isinstance(e, AppError): # Sprawdzamy czy to ten konkretny błąd | |
error_message = f"Zdalny serwis ({TARGET_SPACE_ID}) zgłosił wewnętrzny błąd. Najczęstszą przyczyną są problemy z obrazkiem wejściowym (np. brak wykrytej twarzy, nietypowy format) lub przeciążenie serwisu. Spróbuj z innym zdjęciem lub ponownie później." | |
elif "Could not fetch config" in str(e): | |
# ... (reszta obsługi błędów bez zmian) | |
raise gr.Error(error_message) # Pokaż (potencjalnie bardziej pomocny) błąd | |
# Ta funkcja jest teraz wywoływana przez Gradio po kliknięciu przycisku | |
print("\n--- Funkcja generate_photo (gradio_client) została wywołana ---") | |
# 1. Walidacja danych wejściowych | |
if input_selfie is None: | |
print("BŁĄD: Nie wgrano zdjęcia wejściowego.") | |
raise gr.Error("Proszę najpierw wgrać swoje selfie!") # Pokaż błąd w interfejsie | |
if not current_prompt: | |
print("BŁĄD: Prompt jest pusty.") | |
raise gr.Error("Prompt (opis zdjęcia) nie może być pusty!") | |
# Informacja o tokenie (nie jest już krytyczny dla działania, ale może wpływać na limity) | |
if not API_TOKEN: | |
print("INFO: Brak API Tokena. Połączenie z publicznym Space jako anonimowy użytkownik.") | |
print(f"Otrzymano obrazek typu: {type(input_selfie)}, Rozmiar: {input_selfie.size}") | |
print(f"Otrzymano prompt (początek): {current_prompt[:100]}...") | |
# 2. Przygotowanie pliku tymczasowego dla obrazka wejściowego | |
temp_dir = f"temp_input_{uuid.uuid4()}" # Unikalny folder tymczasowy | |
input_image_path = None # Inicjalizacja na wypadek błędu przed przypisaniem | |
try: | |
os.makedirs(temp_dir, exist_ok=True) | |
# Pełna ścieżka do pliku tymczasowego | |
input_image_path = os.path.join(temp_dir, "input_selfie.jpg") | |
# Upewnijmy się, że obraz jest w RGB przed zapisem jako JPEG | |
# To ważne, bo format JPEG nie obsługuje przezroczystości (kanału alfa) | |
rgb_image = input_selfie | |
if input_selfie.mode == 'RGBA': | |
print("Konwertuję obraz RGBA na RGB z białym tłem przed zapisem...") | |
# Stwórz nowy obraz RGB wypełniony białym kolorem | |
rgb_image = Image.new("RGB", input_selfie.size, (255, 255, 255)) | |
# Wklej oryginalny obraz używając jego kanału alfa jako maski | |
rgb_image.paste(input_selfie, mask=input_selfie.split()[3]) | |
# Zapisz przetworzony obraz jako JPEG | |
rgb_image.save(input_image_path, format="JPEG") | |
print(f"Obrazek wejściowy zapisany tymczasowo w: {input_image_path}") | |
except Exception as e: | |
print(f"BŁĄD podczas zapisywania obrazu tymczasowego: {e}") | |
traceback.print_exc() # Pokaż pełny błąd w logach | |
# Spróbuj posprzątać folder tymczasowy nawet jeśli zapis się nie udał | |
if temp_dir and os.path.exists(temp_dir): | |
try: | |
shutil.rmtree(temp_dir) | |
print(f"Folder tymczasowy {temp_dir} usunięty po błędzie zapisu.") | |
except Exception as e_clean: | |
print(f"OSTRZEŻENIE: Nie udało się usunąć folderu tymczasowego {temp_dir} po błędzie zapisu: {e_clean}") | |
# Pokaż błąd użytkownikowi | |
raise gr.Error(f"Problem z przygotowaniem obrazu do wysłania: {e}") | |
# 3. Wywołanie zdalnego API Gradio za pomocą gradio_client | |
output_image = None # Zmienna na wynikowy obrazek | |
client = None # Zmienna na obiekt klienta | |
try: | |
# Używamy TARGET_SPACE_ID zdefiniowanej globalnie | |
print(f"Łączenie z docelowym Space Gradio: {TARGET_SPACE_ID}") | |
# Inicjalizujemy klienta, przekazując ID Space'a i token (jeśli jest) | |
client = Client(TARGET_SPACE_ID, hf_token=API_TOKEN) | |
print("Połączono. Próbuję wywołać funkcję na zdalnym Space...") | |
# --- Konfiguracja parametrów dla InstantX/InstantID --- | |
# Te wartości mogą wymagać dostosowania w zależności od dokładnej | |
# konfiguracji zdalnego Space'a i pożądanych efektów. | |
negative_prompt = "ugly, deformed, noisy, blurry, low contrast, text, signature, watermark, duplicate, multiple people, cartoon, drawing, illustration, sketch" | |
# Popularne style w demo InstantID: Realistic, (No style), Comic book, Disney, Pixar | |
style_name = "Realistic" | |
# Skale ControlNet i IP-Adapter (siła tożsamości) - typowe wartości to 0.6-1.0 | |
cn_scale = 0.8 | |
ip_scale = 0.8 | |
# Nazwa endpointu API w zdalnym Space'u (często '/predict' lub specyficzna jak '/generate_image') | |
# Dla InstantX/InstantID wydaje się, że to '/generate_image' | |
api_endpoint_name = "/generate_image" | |
# ------------------------------------------------------- | |
print(f"Wywołuję endpoint '{api_endpoint_name}' z parametrami:") | |
print(f" Input image path: {input_image_path}") | |
# Nie drukujemy całego promptu, bo może być długi | |
print(f" Prompt (start): {current_prompt[:60]}...") | |
print(f" Negative Prompt (start): {negative_prompt[:60]}...") | |
print(f" Style: {style_name}") | |
print(f" ControlNet Scale: {cn_scale}") | |
print(f" IP-Adapter Scale: {ip_scale}") | |
# Wywołanie funkcji 'predict' na zdalnym kliencie | |
result = client.predict( | |
file(input_image_path), # Obraz twarzy (jako obiekt pliku Gradio) | |
None, # Obraz pozy (opcjonalny, dajemy None) | |
current_prompt, # Prompt tekstowy | |
negative_prompt, # Negatywny prompt | |
style_name, # Nazwa stylu | |
cn_scale, # Skala ControlNet | |
ip_scale, # Skala IP-Adapter (siła tożsamości) | |
api_name=api_endpoint_name # Nazwa endpointu API | |
) | |
# Przetwarzanie wyniku zwróconego przez klienta | |
print(f"Otrzymano wynik od klienta: {type(result)}") | |
# Wydrukuj fragment wyniku, aby zobaczyć jego strukturę | |
print(f"Wynik (fragment): {str(result)[:500]}") | |
# Sprawdzamy, czy wynik jest listą ścieżek do plików (typowe dla Gradio) | |
if isinstance(result, list) and len(result) > 0 and isinstance(result[0], str) and os.path.exists(result[0]): | |
output_file_path = result[0] # Bierzemy pierwszą ścieżkę z listy | |
print(f"Przetwarzam pierwszy obrazek wynikowy ze ścieżki: {output_file_path}") | |
# Wczytaj obrazek wynikowy z tej ścieżki za pomocą Pillow | |
output_image = Image.open(output_file_path) | |
print(f"Obrazek wynikowy załadowany pomyślnie. Rozmiar: {output_image.size}") | |
# Sprawdzamy, czy wynik jest pojedynczą ścieżką do pliku | |
elif isinstance(result, str) and os.path.exists(result): | |
output_file_path = result | |
print(f"Przetwarzam obrazek wynikowy ze ścieżki: {output_file_path}") | |
output_image = Image.open(output_file_path) | |
print(f"Obrazek wynikowy załadowany pomyślnie. Rozmiar: {output_image.size}") | |
else: | |
# Jeśli wynik nie jest ani listą ścieżek, ani pojedynczą ścieżką | |
print(f"BŁĄD: Otrzymano nieoczekiwany format wyniku od gradio_client: {type(result)}") | |
raise gr.Error(f"Nie udało się przetworzyć wyniku ze zdalnego API. Otrzymano: {str(result)[:200]}") | |
except Exception as e: | |
# Obsługa wszelkich błędów podczas komunikacji z klientem lub przetwarzania wyniku | |
print(f"BŁĄD podczas komunikacji z klientem Gradio lub przetwarzania wyniku: {e}") | |
traceback.print_exc() # Pokaż pełny błąd w logach | |
# Spróbuj dać użytkownikowi bardziej pomocny komunikat | |
error_message = f"Problem podczas generowania przez zdalny serwis InstantID: {e}" | |
if "Could not fetch config" in str(e): | |
error_message = f"Nie można połączyć się z konfiguracją zdalnego serwisu ({TARGET_SPACE_ID}). Może być chwilowo niedostępny, przeciążony lub wymagać logowania. Spróbuj ponownie później." | |
elif "timed out" in str(e).lower(): | |
error_message = "Przekroczono limit czasu oczekiwania na odpowiedź ze zdalnego serwisu. Może być przeciążony. Spróbuj ponownie." | |
elif "queue full" in str(e).lower(): | |
error_message = "Kolejka w zdalnym serwisie jest pełna. Spróbuj ponownie za chwilę." | |
# Pokaż błąd w interfejsie Gradio | |
raise gr.Error(error_message) | |
finally: | |
# 4. Sprzątanie - ZAWSZE próbuj usunąć folder tymczasowy, nawet jeśli był błąd | |
if temp_dir and os.path.exists(temp_dir): | |
try: | |
shutil.rmtree(temp_dir) | |
print(f"Folder tymczasowy {temp_dir} usunięty.") | |
except Exception as e_clean: | |
# Tylko ostrzeżenie, jeśli sprzątanie się nie uda | |
print(f"OSTRZEŻENIE: Nie udało się usunąć folderu tymczasowego {temp_dir}: {e_clean}") | |
# 5. Zwróć wynik (załadowany obrazek PIL), jeśli się udało | |
if output_image: | |
print("Zwracam wygenerowany obrazek do interfejsu Gradio.") | |
return output_image | |
else: | |
# Ten kod nie powinien zostać osiągnięty, jeśli błędy są poprawnie obsługiwane | |
print("BŁĄD KRYTYCZNY: Brak obrazka wynikowego po zakończeniu funkcji, a nie zgłoszono błędu.") | |
raise gr.Error("Nie udało się uzyskać obrazka wynikowego z nieznanego powodu.") | |
# --- Budowa Interfejsu Gradio --- | |
print("--- Definiowanie interfejsu Gradio ---") | |
# Tworzymy główny blok aplikacji Gradio | |
with gr.Blocks(css="footer {display: none !important}") as demo: # Ukrywamy domyślny footer Gradio | |
# Tytuł i opis aplikacji wyświetlany użytkownikowi | |
gr.Markdown( | |
""" | |
# Generator Profesjonalnych Zdjęć Profilowych | |
Wgraj swoje selfie, a my (korzystając z modelu InstantID) postaramy się stworzyć profesjonalne zdjęcie w stylu LinkedIn! | |
**Wskazówki:** | |
* Użyj wyraźnego zdjęcia twarzy, patrzącej w miarę prosto, dobrze oświetlonej. | |
* Unikaj zdjęć grupowych, bardzo małych lub z mocno zasłoniętą twarzą. | |
* Generowanie może potrwać od 30 sekund do kilku minut, bądź cierpliwy! | |
""" | |
) | |
# Układ interfejsu w dwóch kolumnach | |
with gr.Row(): | |
# Kolumna lewa (wejście) | |
with gr.Column(scale=1): | |
# Komponent do wgrywania obrazka | |
input_image = gr.Image( | |
label="1. Wgraj swoje selfie (JPG/PNG)", | |
type="pil" # Chcemy obiekt PIL w funkcji Pythona | |
) | |
# Pole tekstowe do wpisania promptu (opisu zdjęcia) | |
prompt_input = gr.Textbox( | |
label="2. Opis pożądanego zdjęcia (prompt)", | |
value=LINKEDIN_PROMPT, # Ustawiamy domyślny prompt | |
lines=4 # Określamy wysokość pola | |
) | |
# Przycisk uruchamiający generowanie | |
generate_button = gr.Button("✨ Generuj Zdjęcie Biznesowe ✨", variant="primary") # Wyróżniony przycisk | |
# Kolumna prawa (wyjście) | |
with gr.Column(scale=1): | |
# Komponent do wyświetlania wyniku (obrazka) | |
output_image = gr.Image( | |
label="Oto Twoje wygenerowane zdjęcie:", | |
type="pil" # Oczekujemy obiektu PIL jako wynik | |
) | |
# --- Podłączenie akcji do przycisku --- | |
# Definiujemy, co ma się stać po kliknięciu przycisku 'generate_button' | |
generate_button.click( | |
fn=generate_photo, # Wywołaj funkcję 'generate_photo' | |
inputs=[input_image, prompt_input], # Przekaż zawartość 'input_image' i 'prompt_input' jako argumenty | |
outputs=[output_image] # Wynik funkcji umieść w komponencie 'output_image' | |
) | |
print("--- Interfejs Gradio zdefiniowany ---") | |
# --- Uruchomienie aplikacji --- | |
if __name__ == "__main__": | |
print("--- Uruchamianie demo.launch() ---") | |
# Uruchamiamy aplikację Gradio | |
# share=False: nie generuj publicznego linku (zalecane dla bezpieczeństwa) | |
# debug=False: wyłącz tryb debugowania Gradio (zalecane dla produkcji) | |
demo.launch(share=False, debug=False) | |
print("--- Aplikacja Gradio zakończyła działanie (jeśli nie jest w trybie ciągłym serwera) ---") |