Spaces:

Docfile
/

Testpdf

Running

File size: 17,564 Bytes

from flask import Flask, Response, request, stream_with_context
from google import genai
from google.genai import types
import os
from PIL import Image
import io
import base64
import json
import requests # Pour les requêtes HTTP vers l'API Telegram

# --- Configuration ---
GOOGLE_API_KEY = os.environ.get("GEMINI_API_KEY")
TELEGRAM_BOT_TOKEN = os.environ.get("TELEGRAM_BOT_TOKEN") # Récupérer depuis les variables d'env
TELEGRAM_CHAT_ID = os.environ.get("TELEGRAM_CHAT_ID")     # Récupérer depuis les variables d'env

if not GOOGLE_API_KEY:
    raise ValueError("La variable d'environnement GEMINI_API_KEY n'est pas définie.")
# Optionnel: vérifier aussi TELEGRAM_BOT_TOKEN et TELEGRAM_CHAT_ID si vous voulez forcer leur utilisation
# if not TELEGRAM_BOT_TOKEN or not TELEGRAM_CHAT_ID:
#     print("Attention: Les variables d'environnement Telegram ne sont pas toutes définies. L'envoi à Telegram pourrait échouer.")


app = Flask(__name__)

try:
    client = genai.GenerativeModel(
        model_name="gemini-1.5-flash-latest", # Ou "gemini-1.5-pro-latest" ou celui que vous voulez utiliser par défaut
        api_key=GOOGLE_API_KEY,
        generation_config=types.GenerationConfig(
            # candidate_count=1, # Inutile pour le streaming simple
            # stop_sequences=['$'], # Si besoin
            # max_output_tokens=2048, # Si besoin
            temperature=0.7, # Ajustez selon le besoin
        ),
        # safety_settings = Adjust safety settings
        # See https://ai.google.dev/gemini-api/docs/safety-settings
    )
except Exception as e:
    print(f"Erreur lors de l'initialisation du client GenAI : {e}")
    client = None # Pour éviter des erreurs si l'initialisation échoue

# --- Fonctions Utilitaires ---
def send_to_telegram(image_data, caption="Nouvelle image pour résolution"):
    if not TELEGRAM_BOT_TOKEN or not TELEGRAM_CHAT_ID:
        print("Envoi à Telegram désactivé (variables d'environnement manquantes).")
        return False
    try:
        url = f"https://api.telegram.org/bot{TELEGRAM_BOT_TOKEN}/sendPhoto"
        files = {'photo': ('image.png', image_data, 'image/png')}
        data = {'chat_id': TELEGRAM_CHAT_ID, 'caption': caption}
        response = requests.post(url, files=files, data=data, timeout=10)
        if response.status_code == 200:
            print("Image envoyée avec succès à Telegram.")
            return True
        else:
            print(f"Erreur lors de l'envoi à Telegram ({response.status_code}): {response.text}")
            return False
    except Exception as e:
        print(f"Exception lors de l'envoi à Telegram: {e}")
        return False

# --- Code HTML/CSS/JS pour le Frontend ---
HTML_PAGE = """
<!DOCTYPE html>
<html lang="fr">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Gemini Image Solver</title>
    <style>
        body { font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; margin: 0; padding: 20px; background-color: #f0f2f5; color: #333; display: flex; flex-direction: column; align-items: center; }
        .container { background-color: #fff; padding: 25px; border-radius: 8px; box-shadow: 0 4px 12px rgba(0,0,0,0.1); width: 100%; max-width: 700px; }
        h1 { color: #1a73e8; text-align: center; margin-bottom: 25px; }
        input[type="file"] { display: block; margin-bottom: 15px; padding: 10px; border: 1px solid #ddd; border-radius: 4px; width: calc(100% - 22px); }
        button { background-color: #1a73e8; color: white; padding: 12px 20px; border: none; border-radius: 4px; cursor: pointer; font-size: 16px; transition: background-color 0.3s; }
        button:hover { background-color: #1558b0; }
        button:disabled { background-color: #ccc; cursor: not-allowed; }
        #response-container { margin-top: 25px; }
        #status { margin-bottom: 10px; font-style: italic; color: #555; }
        #response-area { background-color: #e8f0fe; border: 1px solid #d1e0fc; border-radius: 4px; padding: 15px; min-height: 100px; white-space: pre-wrap; word-wrap: break-word; }
        .copy-button { background-color: #34a853; margin-top: 10px; }
        .copy-button:hover { background-color: #2a8442; }
        .thinking-dot { display: inline-block; width: 8px; height: 8px; background-color: #1a73e8; border-radius: 50%; margin: 0 2px; animation: blink 1.4s infinite both; }
        .thinking-dot:nth-child(2) { animation-delay: .2s; }
        .thinking-dot:nth-child(3) { animation-delay: .4s; }
        @keyframes blink { 0%, 80%, 100% { opacity: 0; } 40% { opacity: 1; } }
    </style>
</head>
<body>
    <div class="container">
        <h1>Résoudre une image avec Gemini</h1>
        <input type="file" id="imageUpload" accept="image/*">
        <button id="solveButton">Envoyer et Résoudre</button>
        
        <div id="response-container">
            <div id="status">Prêt à recevoir une image.</div>
            <h2>Réponse de Gemini:</h2>
            <div id="response-area"></div>
            <button id="copyButton" class="copy-button" style="display:none;">Copier la Réponse</button>
        </div>
    </div>

    <script>
        const imageUpload = document.getElementById('imageUpload');
        const solveButton = document.getElementById('solveButton');
        const responseArea = document.getElementById('response-area');
        const statusDiv = document.getElementById('status');
        const copyButton = document.getElementById('copyButton');
        let fullResponse = '';

        solveButton.addEventListener('click', async () => {
            const file = imageUpload.files[0];
            if (!file) {
                statusDiv.textContent = 'Veuillez sélectionner une image.';
                return;
            }

            solveButton.disabled = true;
            responseArea.textContent = '';
            fullResponse = '';
            copyButton.style.display = 'none';
            statusDiv.innerHTML = 'Envoi et traitement en cours <span class="thinking-dot"></span><span class="thinking-dot"></span><span class="thinking-dot"></span>';

            const formData = new FormData();
            formData.append('image', file);

            try {
                const response = await fetch('/solve', {
                    method: 'POST',
                    body: formData
                });

                if (!response.ok) {
                    const errorData = await response.json();
                    throw new Error(errorData.error || `Erreur serveur: ${response.status}`);
                }

                const reader = response.body.getReader();
                const decoder = new TextDecoder();
                let buffer = '';

                statusDiv.textContent = 'Réception de la réponse...';

                while (true) {
                    const { value, done } = await reader.read();
                    if (done) break;
                    
                    buffer += decoder.decode(value, { stream: true });
                    
                    // Process Server-Sent Events
                    let eventEndIndex;
                    while ((eventEndIndex = buffer.indexOf('\\n\\n')) !== -1) {
                        const eventString = buffer.substring(0, eventEndIndex);
                        buffer = buffer.substring(eventEndIndex + 2); // Length of '\n\n'

                        if (eventString.startsWith('data: ')) {
                            try {
                                const jsonData = JSON.parse(eventString.substring(6)); // Length of 'data: '
                                if (jsonData.error) {
                                    responseArea.textContent += `ERREUR: ${jsonData.error}\\n`;
                                    statusDiv.textContent = 'Erreur lors de la génération.';
                                    console.error("SSE Error:", jsonData.error);
                                    break; 
                                }
                                if (jsonData.mode === 'thinking') {
                                    statusDiv.innerHTML = 'Gemini réfléchit <span class="thinking-dot"></span><span class="thinking-dot"></span><span class="thinking-dot"></span>';
                                } else if (jsonData.mode === 'answering') {
                                    statusDiv.textContent = 'Gemini répond...';
                                }
                                if (jsonData.content) {
                                    responseArea.textContent += jsonData.content;
                                    fullResponse += jsonData.content;
                                }
                            } catch (e) {
                                console.error("Error parsing SSE JSON:", e, "Data:", eventString);
                            }
                        }
                    }
                }
                // Process any remaining buffer content if needed (though for SSE, it should end with \n\n)
                statusDiv.textContent = 'Terminé.';
                if(fullResponse) {
                    copyButton.style.display = 'block';
                }

            } catch (error) {
                console.error('Erreur:', error);
                responseArea.textContent = `Erreur: ${error.message}`;
                statusDiv.textContent = 'Une erreur est survenue.';
            } finally {
                solveButton.disabled = false;
            }
        });

        copyButton.addEventListener('click', () => {
            if (navigator.clipboard && fullResponse) {
                navigator.clipboard.writeText(fullResponse)
                    .then(() => {
                        const originalText = copyButton.textContent;
                        copyButton.textContent = 'Copié !';
                        setTimeout(() => { copyButton.textContent = originalText; }, 2000);
                    })
                    .catch(err => {
                        console.error('Erreur de copie: ', err);
                        statusDiv.textContent = 'Erreur lors de la copie.';
                    });
            } else {
                 // Fallback for older browsers or if clipboard API not available
                try {
                    const textArea = document.createElement("textarea");
                    textArea.value = fullResponse;
                    document.body.appendChild(textArea);
                    textArea.focus();
                    textArea.select();
                    document.execCommand('copy');
                    document.body.removeChild(textArea);
                    const originalText = copyButton.textContent;
                    copyButton.textContent = 'Copié !';
                    setTimeout(() => { copyButton.textContent = originalText; }, 2000);
                } catch (err) {
                    console.error('Fallback copy error:', err);
                    statusDiv.textContent = "La copie a échoué. Veuillez copier manuellement.";
                }
            }
        });
    </script>
</body>
</html>
"""

# --- Routes Flask ---
@app.route('/')
def index():
    return HTML_PAGE

@app.route('/solve', methods=['POST'])
def solve_image_route():
    if client is None:
        return Response(
            stream_with_context(iter([f'data: {json.dumps({"error": "Le client Gemini n\'est pas initialisé."})}\n\n'])),
            mimetype='text/event-stream'
        )
        
    if 'image' not in request.files:
        return Response(
            stream_with_context(iter([f'data: {json.dumps({"error": "Aucun fichier image fourni."})}\n\n'])),
            mimetype='text/event-stream'
        )

    file = request.files['image']
    if file.filename == '':
        return Response(
            stream_with_context(iter([f'data: {json.dumps({"error": "Aucun fichier sélectionné."})}\n\n'])),
            mimetype='text/event-stream'
        )

    try:
        image_data = file.read()
        # Pour réutiliser image_data, il faut le "rembobiner" si on le lit plusieurs fois
        # ou le stocker après la première lecture.
        
        # Envoyer l'image à Telegram (optionnel)
        # Note: send_to_telegram attend des bytes, image_data est déjà en bytes.
        send_to_telegram(image_data, "Image reçue pour résolution Gemini")

        # Préparer l'image pour Gemini
        img = Image.open(io.BytesIO(image_data))
        # Assurez-vous que le format est supporté par Gemini (PNG, JPEG, WEBP, HEIC, HEIF)
        if img.format not in ['PNG', 'JPEG', 'WEBP', 'HEIC', 'HEIF']:
            print(f"Format d'image original {img.format} non optimal, conversion en PNG.")
            output_format = "PNG"
        else:
            output_format = img.format
        
        buffered = io.BytesIO()
        img.save(buffered, format=output_format)
        img_bytes_for_gemini = buffered.getvalue()

        # Le prompt pour Gemini
        prompt_parts = [
            types.Part.from_data(data=img_bytes_for_gemini, mime_type=f'image/{output_format.lower()}'),
            types.Part.from_text("Résous ceci. Explique clairement ta démarche en français. Si c'est une équation ou un calcul, utilise le format LaTeX pour les formules mathématiques.")
        ]

        def generate_stream():
            current_mode = 'starting'
            try:
                # Utilisation de generate_content avec stream=True
                # Le modèle choisi est "gemini-1.5-flash-latest" dans l'init du client
                # Vous pouvez le changer ici si besoin pour cette route spécifique
                # ou utiliser un client différent pour un modèle différent.
                response_stream = client.generate_content(
                    contents=prompt_parts,
                    stream=True,
                    # generation_config peut être surchargé ici si besoin
                    # request_options={"timeout": 600} # Optionnel: timeout pour la requête
                )

                for chunk in response_stream:
                    # La structure de 'chunk' pour 1.5 peut différer un peu de l'API client précédente
                    # Il n'y a plus de 'thought' directement visible comme avant dans les chunks.
                    # La gestion "thinking" / "answering" devient moins directe.
                    # On va simplifier : on envoie le contenu dès qu'il arrive.
                    if current_mode != "answering":
                        yield f'data: {json.dumps({"mode": "answering"})}\n\n'
                        current_mode = "answering"
                    
                    if chunk.parts:
                        for part in chunk.parts:
                            if hasattr(part, 'text') and part.text:
                                yield f'data: {json.dumps({"content": part.text})}\n\n'
                    elif hasattr(chunk, 'text') and chunk.text: # Pour certains retours directs
                         yield f'data: {json.dumps({"content": chunk.text})}\n\n'


            except types.generation_types.BlockedPromptException as bpe:
                print(f"Blocked Prompt Exception: {bpe}")
                yield f'data: {json.dumps({"error": f"La requête a été bloquée en raison des filtres de sécurité: {bpe}"})}\n\n'
            except types.generation_types.StopCandidateException as sce:
                print(f"Stop Candidate Exception: {sce}")
                yield f'data: {json.dumps({"error": f"La génération s'est arrêtée prématurément: {sce}"})}\n\n'
            except Exception as e:
                print(f"Erreur pendant la génération Gemini: {e}")
                yield f'data: {json.dumps({"error": f"Une erreur est survenue avec Gemini: {str(e)}"})}\n\n'
            finally:
                yield f'data: {json.dumps({"mode": "finished"})}\n\n'


        return Response(
            stream_with_context(generate_stream()),
            mimetype='text/event-stream',
            headers={
                'Cache-Control': 'no-cache',
                'X-Accel-Buffering': 'no', # Important pour Nginx si utilisé comme reverse proxy
                'Connection': 'keep-alive'
            }
        )

    except Exception as e:
        print(f"Erreur générale dans /solve: {e}")
        # Renvoyer l'erreur en SSE pour que le client puisse l'afficher
        return Response(
            stream_with_context(iter([f'data: {json.dumps({"error": f"Une erreur inattendue est survenue sur le serveur: {str(e)}"})}\n\n'])),
            mimetype='text/event-stream'
        )


if __name__ == '__main__':
    # Assurez-vous que les variables d'environnement sont chargées
    # par exemple, si vous utilisez un fichier .env avec python-dotenv:
    # from dotenv import load_dotenv
    # load_dotenv()
    # GOOGLE_API_KEY = os.environ.get("GEMINI_API_KEY")
    # TELEGRAM_BOT_TOKEN = os.environ.get("TELEGRAM_BOT_TOKEN")
    # TELEGRAM_CHAT_ID = os.environ.get("TELEGRAM_CHAT_ID")
    # (et réinitialisez le client si les clés sont chargées après l'init initiale)

    # Vérification finale avant de lancer
    if not GOOGLE_API_KEY:
        print("ERREUR CRITIQUE: GEMINI_API_KEY n'est pas défini. L'application ne peut pas démarrer correctement.")
    elif client is None:
        print("ERREUR CRITIQUE: Le client Gemini n'a pas pu être initialisé. Vérifiez votre clé API et la connectivité.")
    else:
        print("Prêt à démarrer Flask.")
        app.run(debug=True, host='0.0.0.0', port=5000)