Final_Assignment_Template

Sleeping

App Files Files Community

gdms commited on May 8

Commit

f77d0ec

1 Parent(s): 75ce402

processador de imagem chamando GPT, mas falhando na contagem

Browse files

Files changed (2) hide show

tool_audio_extractor.py +16 -3
tool_video_analyzer.py +23 -7

tool_audio_extractor.py CHANGED Viewed

@@ -10,8 +10,10 @@ import base64
 import time
 import json
 import re
 from openai import OpenAI
 # --- Configurações (Substitua os placeholders) ---
 VIDEO_URL = "https://www.youtube.com/watch?v=1htKBjuUWec"  # Substitua pela URL do vídeo do YouTube
 OUTPUT_DIR = "./audio_analysis_output" # Diretório para salvar o áudio
@@ -25,11 +27,23 @@ if VIDEO_URL == "URL_DO_SEU_VIDEO_AQUI":
 # --- Funções ---
-def create_output_directory():
     """Cria o diretório de saída se não existir."""
     if not os.path.exists(OUTPUT_DIR):
         os.makedirs(OUTPUT_DIR)
         print(f"Diretório criado: {OUTPUT_DIR}")
 def retirar_sufixo_codec_arquivo(directory) -> None:
     for filename in os.listdir(directory):
@@ -110,8 +124,7 @@ def extract_text_from_audio() -> str:
 # --- Atualização do Bloco Principal ---
 # (Adicionar inicialização do cliente OpenAI e o loop de análise)
 if __name__ == "__main__":
-    create_output_directory()
     # Etapa 1: Baixar o vídeo
     video_downloaded_or_exists = False
     if VIDEO_URL != "URL_DO_SEU_VIDEO_AQUI":

 import time
 import json
 import re
+import shutil
 from openai import OpenAI
 # --- Configurações (Substitua os placeholders) ---
 VIDEO_URL = "https://www.youtube.com/watch?v=1htKBjuUWec"  # Substitua pela URL do vídeo do YouTube
 OUTPUT_DIR = "./audio_analysis_output" # Diretório para salvar o áudio
 # --- Funções ---
+def create_or_clear_output_directory():
     """Cria o diretório de saída se não existir."""
     if not os.path.exists(OUTPUT_DIR):
         os.makedirs(OUTPUT_DIR)
         print(f"Diretório criado: {OUTPUT_DIR}")
+    else:
+        # Limpa todos os arquivos e subdiretórios
+        for filename in os.listdir(OUTPUT_DIR):
+            file_path = os.path.join(OUTPUT_DIR, filename)
+            try:
+                if os.path.isfile(file_path) or os.path.islink(file_path):
+                    os.unlink(file_path)
+                elif os.path.isdir(file_path):
+                    shutil.rmtree(file_path)
+            except Exception as e:
+                print(f"Erro ao excluir {file_path}: {e}")
+        print(f"Diretório limpo: {OUTPUT_DIR}")
 def retirar_sufixo_codec_arquivo(directory) -> None:
     for filename in os.listdir(directory):
 # --- Atualização do Bloco Principal ---
 # (Adicionar inicialização do cliente OpenAI e o loop de análise)
 if __name__ == "__main__":
+    create_or_clear_output_directory()
     # Etapa 1: Baixar o vídeo
     video_downloaded_or_exists = False
     if VIDEO_URL != "URL_DO_SEU_VIDEO_AQUI":

tool_video_analyzer.py CHANGED Viewed

@@ -11,6 +11,7 @@ import time
 from openai import OpenAI # Importa a classe OpenAI
 import json
 import re
 # --- Configurações (Substitua os placeholders) ---
 VIDEO_URL = "https://www.youtube.com/watch?v=L1vXCYZAYYM"  # Substitua pela URL do vídeo do YouTube
@@ -18,7 +19,8 @@ OUTPUT_DIR = "./video_analysis_output" # Diretório para salvar o vídeo e os fr
 FRAME_INTERVAL_SECONDS = 3 # Intervalo entre frames a serem extraídos
 OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
 GPT_MODEL = "gpt-4o" # Modelo GPT a ser usado (certifique-se que é o correto para análise de imagem)
-PROMPT_TEXT = "Quantas aves existem nesta imagem? Responda apenas com o número." # Prompt para o GPT-4o
 RESULTS_FILE = os.path.join(OUTPUT_DIR, "analysis_results.json")
 VIDEO_FILENAME = "downloaded_video.mp4"
 VIDEO_PATH = os.path.join(OUTPUT_DIR, VIDEO_FILENAME)
@@ -36,11 +38,23 @@ if VIDEO_URL == "URL_DO_SEU_VIDEO_AQUI":
 # --- Funções ---
-def create_output_directory():
     """Cria o diretório de saída se não existir."""
     if not os.path.exists(OUTPUT_DIR):
         os.makedirs(OUTPUT_DIR)
         print(f"Diretório criado: {OUTPUT_DIR}")
 def retirar_sufixo_codec_arquivo(directory) -> None:
     for filename in os.listdir(directory):
@@ -167,8 +181,6 @@ def encode_frame_to_base64(frame_path):
 def analyze_frame_with_gpt4o(client, base64_image, prompt):
-    print("NAO CHAMAR AINDA")
-    return
     """Envia um frame codificado em base64 para a API GPT-4o e retorna a análise."""
     print(f"Enviando frame para análise no {GPT_MODEL}...")
@@ -246,7 +258,7 @@ def save_results_to_json(results_list, output_file):
 # --- Atualização do Bloco Principal ---
 # (Adicionar inicialização do cliente OpenAI e o loop de análise)
 if __name__ == "__main__":
-    create_output_directory()
     extracted_frames = []
     analysis_results_list = []
@@ -297,15 +309,17 @@ if __name__ == "__main__":
                 pass # Mantém 'unknown' se o parsing falhar
             # Codifica o frame
             base64_image = encode_frame_to_base64(frame_path)
             if base64_image:
                 # Analisa o frame com GPT-4o
-                # analysis_result = analyze_frame_with_gpt4o(openai_client, base64_image, PROMPT_TEXT)
                 result_entry = {
                     "frame_path": frame_path,
                     "timestamp_approx_sec": timestamp_str,
-                    "analysis": f' pulado frame {frame_path}' #analysis_result
                 }
                 analysis_results_list.append(result_entry)
@@ -318,6 +332,8 @@ if __name__ == "__main__":
                     "timestamp_approx_sec": timestamp_str,
                     "analysis": {"error": "Failed to encode frame to base64."}
                 })
         print("\nAnálise de todos os frames concluída.")
     elif not extracted_frames:
         print("Nenhum frame foi extraído. Pulando etapa de análise.")

 from openai import OpenAI # Importa a classe OpenAI
 import json
 import re
+import shutil
 # --- Configurações (Substitua os placeholders) ---
 VIDEO_URL = "https://www.youtube.com/watch?v=L1vXCYZAYYM"  # Substitua pela URL do vídeo do YouTube
 FRAME_INTERVAL_SECONDS = 3 # Intervalo entre frames a serem extraídos
 OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
 GPT_MODEL = "gpt-4o" # Modelo GPT a ser usado (certifique-se que é o correto para análise de imagem)
+#PROMPT_TEXT = "You are an image analyzer, do not return any explanation. If asked to count items, return only an integer. If in doubt, return 0. How many different bird species are visible in the image?" # Prompt para o GPT-4o
+PROMPT_TEXT = "You are an expert in visual species classification. Based on the image provided, determine and return the number of distinct bird species visible. Do not count individuals — only count different species based on visual traits like size, shape, color, and beak structure. Return only a single integer. If unsure, return your best estimate. Do not provide explanations or any extra text."
 RESULTS_FILE = os.path.join(OUTPUT_DIR, "analysis_results.json")
 VIDEO_FILENAME = "downloaded_video.mp4"
 VIDEO_PATH = os.path.join(OUTPUT_DIR, VIDEO_FILENAME)
 # --- Funções ---
+def create_or_clear_output_directory():
     """Cria o diretório de saída se não existir."""
     if not os.path.exists(OUTPUT_DIR):
         os.makedirs(OUTPUT_DIR)
         print(f"Diretório criado: {OUTPUT_DIR}")
+    else:
+        # Limpa todos os arquivos e subdiretórios
+        for filename in os.listdir(OUTPUT_DIR):
+            file_path = os.path.join(OUTPUT_DIR, filename)
+            try:
+                if os.path.isfile(file_path) or os.path.islink(file_path):
+                    os.unlink(file_path)
+                elif os.path.isdir(file_path):
+                    shutil.rmtree(file_path)
+            except Exception as e:
+                print(f"Erro ao excluir {file_path}: {e}")
+        print(f"Diretório limpo: {OUTPUT_DIR}")
 def retirar_sufixo_codec_arquivo(directory) -> None:
     for filename in os.listdir(directory):
 def analyze_frame_with_gpt4o(client, base64_image, prompt):
     """Envia um frame codificado em base64 para a API GPT-4o e retorna a análise."""
     print(f"Enviando frame para análise no {GPT_MODEL}...")
 # --- Atualização do Bloco Principal ---
 # (Adicionar inicialização do cliente OpenAI e o loop de análise)
 if __name__ == "__main__":
+    create_or_clear_output_directory()
     extracted_frames = []
     analysis_results_list = []
                 pass # Mantém 'unknown' se o parsing falhar
             # Codifica o frame
+            #teste com a imagem correta
+            frame_path = f"{OUTPUT_DIR}/frame_0031_time_93.00s.png"
             base64_image = encode_frame_to_base64(frame_path)
             if base64_image:
                 # Analisa o frame com GPT-4o
+                analysis_result = analyze_frame_with_gpt4o(openai_client, base64_image, PROMPT_TEXT)
                 result_entry = {
                     "frame_path": frame_path,
                     "timestamp_approx_sec": timestamp_str,
+                    "analysis": analysis_result
                 }
                 analysis_results_list.append(result_entry)
                     "timestamp_approx_sec": timestamp_str,
                     "analysis": {"error": "Failed to encode frame to base64."}
                 })
+            break # teste somente uma chamada
         print("\nAnálise de todos os frames concluída.")
     elif not extracted_frames:
         print("Nenhum frame foi extraído. Pulando etapa de análise.")