YTB-TEST

Running

App Files Files Community

fantaxy commited on Jun 19

Commit

b075ad9

verified ·

1 Parent(s): c3dab7d

Update app.py

Browse files

Files changed (1) hide show

app.py +56 -33

app.py CHANGED Viewed

@@ -87,7 +87,7 @@ class YouTubeDownloader:
         return youtube_regex.match(url) is not None
     # ---------------------------------------------------------
-    # Gemini-AI 장면 분석 (한글 우선)
     # ---------------------------------------------------------
     def generate_scene_breakdown_gemini(self, video_info):
         if not self.gemini_model:
@@ -105,28 +105,38 @@ class YouTubeDownloader:
                 }
             prompt = f"""
-이 YouTube 비디오를 분석하여 한국어로 상세한 장면별 설명을 작성해주세요.
 제목: {title}
 재생시간: {duration}초
 설명: {description}
-중요 지침:
-1. 각 장면을 한국어로 상세히 설명하되 다음 내용을 포함하세요:
-   - 등장인물의 외모와 행동
-   - 배경과 환경
-   - 주요 대사나 내용
-   - 화면에 표시되는 텍스트나 그래픽
-   - 분위기와 톤
-2. 타임스탬프 가이드라인:
-   - 1분 미만: 2-3초 단위
-   - 1-5분: 3-5초 단위
-   - 5-15분: 5-10초 단위
-   - 15분 이상: 10-15초 단위
-   - 최대 20개 장면
-3. 형식:
-   **[MM:SS-MM:SS]**: 장면 설명...
-4. 반드시 한국어로만 작성하세요.
 """
             response = self.gemini_model.generate_content(prompt)
@@ -149,11 +159,19 @@ class YouTubeDownloader:
             # 영어 번역 생성
             english_prompt = f"""
-Translate the following Korean scene descriptions to English, maintaining the exact same timestamps:
 {chr(10).join(korean_scenes)}
-Keep the format exactly the same: **[MM:SS-MM:SS]**: English translation...
 """
             english_response = self.gemini_model.generate_content(english_prompt)
@@ -184,7 +202,7 @@ Keep the format exactly the same: **[MM:SS-MM:SS]**: English translation...
             return self.generate_scene_breakdown_fallback(video_info)
     # ---------------------------------------------------------
-    # Fallback 장면 분석 (한글/영어)
     # ---------------------------------------------------------
     def generate_scene_breakdown_fallback(self, video_info):
         duration = video_info.get("duration", 0)
@@ -198,14 +216,15 @@ Keep the format exactly the same: **[MM:SS-MM:SS]**: English translation...
                 "english": ["**[Duration Unknown]**: Unable to generate timestamped breakdown"]
             }
         if duration <= 60:
-            segment_length = 3
         elif duration <= 300:
-            segment_length = 5
         elif duration <= 900:
-            segment_length = 10
         else:
-            segment_length = 15
         korean_scenes = []
         english_scenes = []
@@ -219,12 +238,16 @@ Keep the format exactly the same: **[MM:SS-MM:SS]**: English translation...
             start_fmt = f"{start_time//60}:{start_time%60:02d}"
             end_fmt = f"{end_time//60}:{end_time%60:02d}"
-            korean_desc = self.generate_contextual_description_korean(
-                i, num_segments, video_type, uploader, title
-            )
-            english_desc = self.generate_contextual_description(
-                i, num_segments, video_type, uploader, title
-            )
             korean_scenes.append(f"**[{start_fmt}-{end_fmt}]**: {korean_desc}")
             english_scenes.append(f"**[{start_fmt}-{end_fmt}]**: {english_desc}")
@@ -492,11 +515,11 @@ Keep the format exactly the same: **[MM:SS-MM:SS]**: English translation...
 🎵 **배경음악/Background Music:** {bgm}
 👑 **제작자 상태/Creator Status:** {creator}
-🎬 상세 장면 분석 (한국어) / DETAILED SCENE BREAKDOWN (KOREAN)
 {'─'*30}
 {chr(10).join(korean_scenes)}
-🎬 상세 장면 분석 (영어) / DETAILED SCENE BREAKDOWN (ENGLISH)
 {'─'*30}
 {chr(10).join(english_scenes)}

         return youtube_regex.match(url) is not None
     # ---------------------------------------------------------
+    # Gemini-AI 음성/대사 추출 (한글 우선)
     # ---------------------------------------------------------
     def generate_scene_breakdown_gemini(self, video_info):
         if not self.gemini_model:
                 }
             prompt = f"""
+이 YouTube 비디오의 음성/대사를 타임스탬프별로 추출해주세요.
 제목: {title}
 재생시간: {duration}초
 설명: {description}
+매우 중요한 지침:
+1. 실제 영상에서 들리는 대사, 내레이션, 음성을 그대로 적어주세요
+2. 장면 설명이 아닌 실제 음성 내용만 작성하세요
+3. 음성이 없는 부분은 (...) 또는 (배경음악) 등으로 표시
+4. 타임스탬프 가이드라인:
+   - 대사나 내레이션이 시작하고 끝나는 지점 기준
+   - 연속된 대사는 하나로 묶어서 표시
+   - 최대한 자연스러운 단위로 구분
+5. 형식:
+   **[MM:SS-MM:SS]**: "실제 대사나 내레이션 내용"
+   **[MM:SS-MM:SS]**: (배경음악) 또는 (...장면 전환...)
+6. 모든 음성 내용을 빠짐없이 적어주세요
+7. 자막이나 화면에 표시된 텍스트도 포함하세요
+8. 장면 설명은 절대 하지 마세요. 오직 음성과 텍스트만 추출하세요.
+예시:
+**[00:00-00:05]**: "안녕하세요. 오늘은 미륵산에서 발견된 백제 유적에 대해 알아보겠습니다."
+**[00:05-00:08]**: (배경음악)
+**[00:08-00:15]**: "미륵사지를 품고 있는 익산 미륵산의 정상부에서 백제시대에 만든 것으로 추정되는 저수조가 발굴됐습니다."
+**[00:15-00:18]**: (인터뷰 준비 중...)
+**[00:18-00:25]**: [이도학 교수] "이번 발굴은 백제 역사 연구에 중요한 전환점이 될 것입니다."
+뉴스의 경우:
+- 앵커나 기자의 멘트는 그대로 적기
+- 인터뷰는 [인터뷰이 이름] "내용" 형식으로
+- 자막은 [자막] 내용 형식으로
 """
             response = self.gemini_model.generate_content(prompt)
             # 영어 번역 생성
             english_prompt = f"""
+Translate the following Korean speech/dialogue transcription to English, maintaining the exact same timestamps.
+Translate ONLY the actual speech content, not descriptions:
 {chr(10).join(korean_scenes)}
+Important rules:
+- Keep the format exactly the same: **[MM:SS-MM:SS]**: "English translation of speech"
+- For non-speech parts like (배경음악), translate as (background music)
+- For (...) keep as is
+- For interview tags like [이도학 교수], translate as [Professor Lee Do-hak]
+- For [자막], translate as [Subtitle]
+- Keep quotation marks for actual speech
+- Do NOT add any scene descriptions or explanations
 """
             english_response = self.gemini_model.generate_content(english_prompt)
             return self.generate_scene_breakdown_fallback(video_info)
     # ---------------------------------------------------------
+    # Fallback 음성/대사 추출 (한글/영어)
     # ---------------------------------------------------------
     def generate_scene_breakdown_fallback(self, video_info):
         duration = video_info.get("duration", 0)
                 "english": ["**[Duration Unknown]**: Unable to generate timestamped breakdown"]
             }
+        # 비디오 타입에 따른 대사 템플릿
         if duration <= 60:
+            segment_length = 10
         elif duration <= 300:
+            segment_length = 15
         elif duration <= 900:
+            segment_length = 20
         else:
+            segment_length = 30
         korean_scenes = []
         english_scenes = []
             start_fmt = f"{start_time//60}:{start_time%60:02d}"
             end_fmt = f"{end_time//60}:{end_time%60:02d}"
+            # 음성 추출이 불가능한 경우의 기본 템플릿
+            if i == 0:
+                korean_desc = f"(음성 추출을 위해 Gemini API가 필요합니다. 인트로 부분...)"
+                english_desc = f"(Gemini API required for speech extraction. Intro section...)"
+            elif i == num_segments - 1:
+                korean_desc = f"(아웃트로 부분...)"
+                english_desc = f"(Outro section...)"
+            else:
+                korean_desc = f"(본문 내용...)"
+                english_desc = f"(Main content...)"
             korean_scenes.append(f"**[{start_fmt}-{end_fmt}]**: {korean_desc}")
             english_scenes.append(f"**[{start_fmt}-{end_fmt}]**: {english_desc}")
 🎵 **배경음악/Background Music:** {bgm}
 👑 **제작자 상태/Creator Status:** {creator}
+🎙️ 음성/대사 추출 (한국어) / SPEECH/DIALOGUE EXTRACTION (KOREAN)
 {'─'*30}
 {chr(10).join(korean_scenes)}
+🎙️ 음성/대사 추출 (영어) / SPEECH/DIALOGUE EXTRACTION (ENGLISH)
 {'─'*30}
 {chr(10).join(english_scenes)}