Spaces:

jeongsoo
/

audio_summarizer

Runtime error

App Files Files Community

Jeongsoo1975 commited on Jun 19

Commit

d76d4c0

1 Parent(s): ad0eadb

fix: 오디오 업로드 UI가 표시되지 않는 문제 수정

Browse files

Files changed (2) hide show

app.py +4 -20
requirements.txt +0 -2

app.py CHANGED Viewed

@@ -1,10 +1,7 @@
 import gradio as gr
 import os
 import logging
-import tempfile
-import whisper
 from datetime import datetime
-from stt_processor import TextProcessor
 # 로깅 설정
 logging.basicConfig(
@@ -30,12 +27,14 @@ def initialize_models():
         if not google_api_key:
             return False, "❌ Google API 키가 설정되지 않았습니다. Hugging Face Spaces의 Settings에서 GOOGLE_API_KEY를 설정해주세요."
-        # Whisper 모델 로드
         logger.info("Whisper 모델을 로딩합니다...")
         whisper_model = whisper.load_model("base")
         logger.info("Whisper 모델 로딩 완료")
         # 텍스트 프로세서 초기화
         text_processor = TextProcessor(google_api_key)
         return True, "✅ 모든 모델이 초기화되었습니다."
@@ -46,13 +45,6 @@ def initialize_models():
 def process_audio_file(audio_file, progress=gr.Progress()):
     """
     업로드된 오디오 파일을 처리합니다.
-    Args:
-        audio_file: 업로드된 오디오 파일
-        progress: Gradio 진행률 객체
-    Returns:
-        tuple: (처리 상태, 원본 텍스트, 화자 분리 결과, 교정 결과, 화자1 대화, 화자2 대화)
     """
     global text_processor, whisper_model
@@ -133,13 +125,6 @@ def process_audio_file(audio_file, progress=gr.Progress()):
 def process_text_input(input_text, progress=gr.Progress()):
     """
     입력된 텍스트를 처리합니다.
-    Args:
-        input_text: 처리할 텍스트
-        progress: Gradio 진행률 객체
-    Returns:
-        tuple: (처리 상태, 원본 텍스트, 화자 분리 결과, 교정 결과, 화자1 대화, 화자2 대화)
     """
     global text_processor
@@ -236,8 +221,7 @@ def create_interface():
                         gr.Markdown("### 🎤 오디오 파일 업로드")
                         audio_input = gr.Audio(
                             label="2인 대화 오디오 파일을 업로드하세요",
-                            type="filepath",
-                            format="wav"
                         )
                         audio_process_btn = gr.Button(
                             "🚀 오디오 처리 시작",

 import gradio as gr
 import os
 import logging
 from datetime import datetime
 # 로깅 설정
 logging.basicConfig(
         if not google_api_key:
             return False, "❌ Google API 키가 설정되지 않았습니다. Hugging Face Spaces의 Settings에서 GOOGLE_API_KEY를 설정해주세요."
+        # Whisper 모델 로드 (지연 로딩)
+        import whisper
         logger.info("Whisper 모델을 로딩합니다...")
         whisper_model = whisper.load_model("base")
         logger.info("Whisper 모델 로딩 완료")
         # 텍스트 프로세서 초기화
+        from stt_processor import TextProcessor
         text_processor = TextProcessor(google_api_key)
         return True, "✅ 모든 모델이 초기화되었습니다."
 def process_audio_file(audio_file, progress=gr.Progress()):
     """
     업로드된 오디오 파일을 처리합니다.
     """
     global text_processor, whisper_model
 def process_text_input(input_text, progress=gr.Progress()):
     """
     입력된 텍스트를 처리합니다.
     """
     global text_processor
                         gr.Markdown("### 🎤 오디오 파일 업로드")
                         audio_input = gr.Audio(
                             label="2인 대화 오디오 파일을 업로드하세요",
+                            type="filepath"
                         )
                         audio_process_btn = gr.Button(
                             "🚀 오디오 처리 시작",

requirements.txt CHANGED Viewed

@@ -2,5 +2,3 @@ python-dotenv==1.0.0
 google-generativeai==0.8.3
 gradio==4.44.0
 openai-whisper==20240930
-torch==2.0.1
-torchaudio==2.0.2

 google-generativeai==0.8.3
 gradio==4.44.0
 openai-whisper==20240930