Final_Assignment_Template

Sleeping

App Files Files Community

Final_Assignment_Template / tool_audio_extractor.py

gdms

avanço nas tools

314503f 3 months ago

raw

history blame

6.86 kB

	# -- coding: utf-8 --
	"""
	Script para baixar um vídeo do YouTube, extrair frames, analisar com GPT-4o e contar aves.
	"""

	import os
	import subprocess
	import cv2
	import base64
	import time
	import json
	import re

	# --- Configurações (Substitua os placeholders) ---
	VIDEO_URL = "https://www.youtube.com/watch?v=L1vXCYZAYYM" # Substitua pela URL do vídeo do YouTube
	RESULTS_FILE = os.path.join(OUTPUT_DIR, "analysis_results.json")
	OUTPUT_DIR = "./video_analysis_output" # Diretório para salvar o vídeo e os frames
	AUDIO_FILENAME = "downloaded_audio"
	VIDEO_PATH = os.path.join(OUTPUT_DIR, AUDIO_FILENAME)

	# Verifica se a URL foi definida
	if VIDEO_URL == "URL_DO_SEU_VIDEO_AQUI":
	print("AVISO: A URL do vídeo não foi definida. Por favor, edite o script e insira a URL desejada.")
	# exit(1)

	# --- Funções ---

	def create_output_directory():
	"""Cria o diretório de saída se não existir."""
	if not os.path.exists(OUTPUT_DIR):
	os.makedirs(OUTPUT_DIR)
	print(f"Diretório criado: {OUTPUT_DIR}")

	def retirar_sufixo_codec_arquivo(directory) -> None:
	for filename in os.listdir(directory):
	# Procura padrão como ".f123" antes da extensão
	new_filename = re.sub(r'\.f\d{3}(?=\.\w+$)', '', filename)
	if new_filename != filename:
	old_path = os.path.join(directory, filename)
	new_path = os.path.join(directory, new_filename)
	os.rename(old_path, new_path)
	print(f"Renomeado: {filename} → {new_filename}")


	def download_audio(url, output_path):
	"""Baixa apenas o áudio do YouTube usando yt-dlp."""
	print(f"Baixando áudio de {url} para {output_path}...")
	try:
	# Comando yt-dlp para baixar o melhor áudio disponível e convertê-lo para mp3
	command = [
	'yt-dlp',
	'-f', 'bestaudio',
	'--extract-audio',
	'--audio-format', 'mp3', # Pode ser 'mp3', 'm4a', 'wav', etc.
	'-o', output_path,
	url
	]
	result = subprocess.run(command, check=True, capture_output=True, text=True)
	retirar_sufixo_codec_arquivo(OUTPUT_DIR)

	print("Download de áudio concluído com sucesso.")
	return True
	except subprocess.CalledProcessError as e:
	print(f"Erro ao baixar o áudio: {e}")
	print(f"Saída do erro: {e.stderr}")
	return False
	except FileNotFoundError:
	print("Erro: O comando 'yt-dlp' não foi encontrado. Certifique-se de que ele está instalado e no PATH do sistema.")
	return False



	# --- Atualização do Bloco Principal ---
	# (Adicionar inicialização do cliente OpenAI e o loop de análise)
	if __name__ == "__main__":
	create_output_directory()

	# Etapa 1: Baixar o vídeo
	video_downloaded_or_exists = False
	if VIDEO_URL != "URL_DO_SEU_VIDEO_AQUI":
	if download_video(VIDEO_URL, VIDEO_PATH):
	print(f"Vídeo salvo em: {VIDEO_PATH}")
	video_downloaded_or_exists = True
	else:
	print("Falha no download do vídeo. Pulando etapas dependentes.")
	elif os.path.exists(VIDEO_PATH):
	print(f"URL não fornecida, mas vídeo encontrado em {VIDEO_PATH}. Tentando processar.")
	video_downloaded_or_exists = True
	else:
	print("URL do vídeo não fornecida e vídeo local não encontrado. Pulando download e extração.")

	# Etapa 2: Extrair frames
	if video_downloaded_or_exists:
	extracted_frames = extract_frames(VIDEO_PATH, OUTPUT_DIR, FRAME_INTERVAL_SECONDS)
	else:
	print("Pulando extração de frames pois o vídeo não está disponível.")

	# Etapa 3 e 4: Codificar e Analisar Frames
	if extracted_frames and openai_client:
	print(f"\nIniciando análise de {len(extracted_frames)} frames com {GPT_MODEL}...")
	for frame_path in extracted_frames:
	print(f"\nProcessando frame: {frame_path}")
	# Extrai timestamp do nome do arquivo, se possível
	timestamp_str = "unknown"
	try:
	# Exemplo: frame_0000_time_0.00s.png
	parts = os.path.basename(frame_path).split('_')
	if len(parts) >= 4 and parts[2] == 'time':
	timestamp_str = parts[3].replace('s.png','')
	except Exception:
	pass # Mantém 'unknown' se o parsing falhar

	# Codifica o frame
	base64_image = encode_frame_to_base64(frame_path)

	if base64_image:
	# Analisa o frame com GPT-4o
	# analysis_result = analyze_frame_with_gpt4o(openai_client, base64_image, PROMPT_TEXT)
	result_entry = {
	"frame_path": frame_path,
	"timestamp_approx_sec": timestamp_str,
	"analysis": f' pulado frame {frame_path}' #analysis_result
	}
	analysis_results_list.append(result_entry)

	# Pausa opcional para evitar rate limiting
	time.sleep(1) # Pausa de 1 segundo entre as chamadas
	else:
	print(f"Falha ao codificar o frame {frame_path}. Pulando análise.")
	analysis_results_list.append({
	"frame_path": frame_path,
	"timestamp_approx_sec": timestamp_str,
	"analysis": {"error": "Failed to encode frame to base64."}
	})
	print("\nAnálise de todos os frames concluída.")
	elif not extracted_frames:
	print("Nenhum frame foi extraído. Pulando etapa de análise.")
	elif not openai_client:
	print("Cliente OpenAI não inicializado (verifique a API Key). Pulando etapa de análise.")

	# Próxima etapa: Compilar resultados
	print(f"\nPróxima etapa a ser implementada: Compilação dos resultados ({len(analysis_results_list)} análises) em um relatório.")


	# ... (código anterior para inicialização, download, extração, análise) ...

	# Etapa 5: Compilar e Salvar Resultados
	if analysis_results_list:
	print(f"\nCompilando {len(analysis_results_list)} resultados da análise...")
	if save_results_to_json(analysis_results_list, RESULTS_FILE):
	print("Compilação e salvamento dos resultados concluídos.")
	else:
	print("Falha ao salvar os resultados da análise.")
	else:
	print("Nenhum resultado de análise para compilar.")

	print("\n--- Processo de Análise de Vídeo Concluído ---")
	print(f"Verifique o diretório '{OUTPUT_DIR}' para os frames extraídos (se aplicável).")
	print(f"Verifique o arquivo '{RESULTS_FILE}' para os resultados da análise (se aplicável).")
	print("Lembre-se de substituir os placeholders para URL_DO_SEU_VIDEO_AQUI e SUA_CHAVE_API_OPENAI_AQUI no script.")