Final_Assignment_Template

Sleeping

App Files Files Community

gdms commited on May 6

Commit

4147b5e

1 Parent(s): 314503f

Tool extração audio

Browse files

Files changed (2) hide show

.gitignore +2 -0
tool_audio_extractor.py +52 -79

.gitignore CHANGED Viewed

@@ -2,3 +2,5 @@
 *.xlsx
 video_analysis_output/
 get-pip.py

 *.xlsx
 video_analysis_output/
 get-pip.py
+*.m4a
+*.mp4

tool_audio_extractor.py CHANGED Viewed

@@ -10,13 +10,15 @@ import base64
 import time
 import json
 import re
 # --- Configurações (Substitua os placeholders) ---
-VIDEO_URL = "https://www.youtube.com/watch?v=L1vXCYZAYYM"  # Substitua pela URL do vídeo do YouTube
-RESULTS_FILE = os.path.join(OUTPUT_DIR, "analysis_results.json")
-OUTPUT_DIR = "./video_analysis_output" # Diretório para salvar o vídeo e os frames
 AUDIO_FILENAME = "downloaded_audio"
-VIDEO_PATH = os.path.join(OUTPUT_DIR, AUDIO_FILENAME)
 # Verifica se a URL foi definida
 if VIDEO_URL == "URL_DO_SEU_VIDEO_AQUI":
@@ -47,14 +49,15 @@ def download_audio(url, output_path):
     print(f"Baixando áudio de {url} para {output_path}...")
     try:
         # Comando yt-dlp para baixar o melhor áudio disponível e convertê-lo para mp3
         command = [
             'yt-dlp',
-            '-f', 'bestaudio',
-            '--extract-audio',
-            '--audio-format', 'mp3',  # Pode ser 'mp3', 'm4a', 'wav', etc.
             '-o', output_path,
             url
         ]
         result = subprocess.run(command, check=True, capture_output=True, text=True)
         retirar_sufixo_codec_arquivo(OUTPUT_DIR)
@@ -68,6 +71,37 @@ def download_audio(url, output_path):
         print("Erro: O comando 'yt-dlp' não foi encontrado. Certifique-se de que ele está instalado e no PATH do sistema.")
         return False
 # --- Atualização do Bloco Principal ---
@@ -78,85 +112,24 @@ if __name__ == "__main__":
     # Etapa 1: Baixar o vídeo
     video_downloaded_or_exists = False
     if VIDEO_URL != "URL_DO_SEU_VIDEO_AQUI":
-        if download_video(VIDEO_URL, VIDEO_PATH):
-            print(f"Vídeo salvo em: {VIDEO_PATH}")
             video_downloaded_or_exists = True
         else:
             print("Falha no download do vídeo. Pulando etapas dependentes.")
-    elif os.path.exists(VIDEO_PATH):
-         print(f"URL não fornecida, mas vídeo encontrado em {VIDEO_PATH}. Tentando processar.")
          video_downloaded_or_exists = True
     else:
         print("URL do vídeo não fornecida e vídeo local não encontrado. Pulando download e extração.")
-    # Etapa 2: Extrair frames
-    if video_downloaded_or_exists:
-        extracted_frames = extract_frames(VIDEO_PATH, OUTPUT_DIR, FRAME_INTERVAL_SECONDS)
-    else:
-        print("Pulando extração de frames pois o vídeo não está disponível.")
-    # Etapa 3 e 4: Codificar e Analisar Frames
-    if extracted_frames and openai_client:
-        print(f"\nIniciando análise de {len(extracted_frames)} frames com {GPT_MODEL}...")
-        for frame_path in extracted_frames:
-            print(f"\nProcessando frame: {frame_path}")
-            # Extrai timestamp do nome do arquivo, se possível
-            timestamp_str = "unknown"
-            try:
-                # Exemplo: frame_0000_time_0.00s.png
-                parts = os.path.basename(frame_path).split('_')
-                if len(parts) >= 4 and parts[2] == 'time':
-                   timestamp_str = parts[3].replace('s.png','')
-            except Exception:
-                pass # Mantém 'unknown' se o parsing falhar
-            # Codifica o frame
-            base64_image = encode_frame_to_base64(frame_path)
-            if base64_image:
-                # Analisa o frame com GPT-4o
-                # analysis_result = analyze_frame_with_gpt4o(openai_client, base64_image, PROMPT_TEXT)
-                result_entry = {
-                    "frame_path": frame_path,
-                    "timestamp_approx_sec": timestamp_str,
-                    "analysis": f' pulado frame {frame_path}' #analysis_result
-                }
-                analysis_results_list.append(result_entry)
-                # Pausa opcional para evitar rate limiting
-                time.sleep(1) # Pausa de 1 segundo entre as chamadas
-            else:
-                print(f"Falha ao codificar o frame {frame_path}. Pulando análise.")
-                analysis_results_list.append({
-                    "frame_path": frame_path,
-                    "timestamp_approx_sec": timestamp_str,
-                    "analysis": {"error": "Failed to encode frame to base64."}
-                })
-        print("\nAnálise de todos os frames concluída.")
-    elif not extracted_frames:
-        print("Nenhum frame foi extraído. Pulando etapa de análise.")
-    elif not openai_client:
-        print("Cliente OpenAI não inicializado (verifique a API Key). Pulando etapa de análise.")
-    # Próxima etapa: Compilar resultados
-    print(f"\nPróxima etapa a ser implementada: Compilação dos resultados ({len(analysis_results_list)} análises) em um relatório.")
-    # ... (código anterior para inicialização, download, extração, análise) ...
-    # Etapa 5: Compilar e Salvar Resultados
-    if analysis_results_list:
-        print(f"\nCompilando {len(analysis_results_list)} resultados da análise...")
-        if save_results_to_json(analysis_results_list, RESULTS_FILE):
-            print("Compilação e salvamento dos resultados concluídos.")
-        else:
-            print("Falha ao salvar os resultados da análise.")
-    else:
-        print("Nenhum resultado de análise para compilar.")
-    print("\n--- Processo de Análise de Vídeo Concluído ---")
-    print(f"Verifique o diretório '{OUTPUT_DIR}' para os frames extraídos (se aplicável).")
-    print(f"Verifique o arquivo '{RESULTS_FILE}' para os resultados da análise (se aplicável).")
-    print("Lembre-se de substituir os placeholders para URL_DO_SEU_VIDEO_AQUI e SUA_CHAVE_API_OPENAI_AQUI no script.")

 import time
 import json
 import re
+import openai
 # --- Configurações (Substitua os placeholders) ---
+VIDEO_URL = "https://www.youtube.com/watch?v=1htKBjuUWec"  # Substitua pela URL do vídeo do YouTube
+OUTPUT_DIR = "./audio_analysis_output" # Diretório para salvar o áudio
 AUDIO_FILENAME = "downloaded_audio"
+TRANSCRIPT_FILENAME = "transcript.txt"
+AUDIO_PATH = os.path.join(OUTPUT_DIR, AUDIO_FILENAME)
+TRANSCRIPT_PATH = os.path.join(OUTPUT_DIR, TRANSCRIPT_FILENAME)
 # Verifica se a URL foi definida
 if VIDEO_URL == "URL_DO_SEU_VIDEO_AQUI":
     print(f"Baixando áudio de {url} para {output_path}...")
     try:
         # Comando yt-dlp para baixar o melhor áudio disponível e convertê-lo para mp3
         command = [
             'yt-dlp',
+            '-f', 'bestvideo[ext=mp4]+bestaudio[ext=m4a]/best[ext=mp4]/best',
             '-o', output_path,
             url
         ]
         result = subprocess.run(command, check=True, capture_output=True, text=True)
         retirar_sufixo_codec_arquivo(OUTPUT_DIR)
         print("Erro: O comando 'yt-dlp' não foi encontrado. Certifique-se de que ele está instalado e no PATH do sistema.")
         return False
+def extract_text_from_audio(audio_path, output_txt_path=None) -> str:
+    """
+    Usa a API Whisper da OpenAI para transcrever o áudio em texto com quebras de linha naturais,
+    removendo timestamps e IDs. Salva em arquivo .txt se o caminho for fornecido.
+    """
+    try:
+        openai.api_key = os.getenv("OPENAI_API_KEY")
+        print(f"Iniciando transcrição (formato SRT simplificado): {audio_path}")
+        with open(audio_path, "rb") as audio_file:
+            srt_result = openai.Audio.transcribe(
+                model="whisper-1",
+                file=audio_file,
+                response_format="srt"
+            )
+        # Remove linhas com números e timestamps
+        lines = srt_result.splitlines()
+        only_text = [line.strip() for line in lines if not re.match(r"^\d+$", line) and "-->" not in line]
+        formatted_text = "\n".join(only_text)
+        # Salva em .txt se desejado
+        if output_txt_path:
+            with open(output_txt_path, "w", encoding="utf-8") as f:
+                f.write(formatted_text)
+            print(f"Transcrição salva em: {output_txt_path}")
+        return formatted_text
+    except Exception as e:
+        print(f"Erro ao transcrever áudio: {e}")
+        return ""
 # --- Atualização do Bloco Principal ---
     # Etapa 1: Baixar o vídeo
     video_downloaded_or_exists = False
     if VIDEO_URL != "URL_DO_SEU_VIDEO_AQUI":
+        if download_audio(VIDEO_URL, AUDIO_PATH):
+            print(f"Vídeo salvo em: {AUDIO_PATH}")
             video_downloaded_or_exists = True
         else:
             print("Falha no download do vídeo. Pulando etapas dependentes.")
+    elif os.path.exists(AUDIO_PATH):
+         print(f"URL não fornecida, mas vídeo encontrado em {AUDIO_PATH}. Tentando processar.")
          video_downloaded_or_exists = True
     else:
         print("URL do vídeo não fornecida e vídeo local não encontrado. Pulando download e extração.")
+    if False:
+        # Etapa 2: Extrair frames
+        if video_downloaded_or_exists:
+            extract_text_from_audio(AUDIO_PATH + '.mp3', TRANSCRIPT_PATH)
+        else:
+            print("Pulando extração de frames pois o vídeo não está disponível.")