Open-GAMMA

Running

App Files Files Community

openfree commited on Jun 18

Commit

396a304

verified ·

1 Parent(s): 6b13125

Update app.py

Browse files

Files changed (1) hide show

app.py +106 -52

app.py CHANGED Viewed

@@ -1098,10 +1098,9 @@ def generate_images_parallel(prompt_3d: str, prompt_photo: str) -> Tuple[Optiona
 # PPT Generation Functions - FIXED VERSION
 ##############################################################################
 def parse_llm_ppt_response(response: str, layout_style: str = "consistent") -> list:
-    """Parse LLM response to extract slide content - COMPLETELY FIXED VERSION"""
     slides = []
-    # Debug: 전체 응답 확인
     logger.info(f"Parsing LLM response, total length: {len(response)}")
     logger.debug(f"First 500 chars: {response[:500]}")
@@ -1114,24 +1113,45 @@ def parse_llm_ppt_response(response: str, layout_style: str = "consistent") -> l
     except:
         pass
-    # Split by slide markers and process each section
-    # 슬라이드를 구분하는 더 강력한 정규식
-    slide_pattern = r'(?:^|\n)(?:슬라이드|Slide)\s*\d+|(?:^|\n)\d+[\.)](?:\s|$)'
-    # 슬라이드 섹션으로 분할
-    sections = re.split(slide_pattern, response, flags=re.MULTILINE | re.IGNORECASE)
-    # 첫 번째 빈 섹션 제거
-    if sections and not sections[0].strip():
-        sections = sections[1:]
-    logger.info(f"Found {len(sections)} potential slide sections")
-    for idx, section in enumerate(sections):
-        if not section.strip():
             continue
-        logger.debug(f"Processing section {idx}: {section[:100]}...")
         slide = {
             'title': '',
@@ -1142,9 +1162,9 @@ def parse_llm_ppt_response(response: str, layout_style: str = "consistent") -> l
         }
         # 섹션 내에서 제목, 내용, 노트 추출
-        lines = section.strip().split('\n')
         current_part = None
-        title_lines = []
         content_lines = []
         notes_lines = []
@@ -1154,11 +1174,11 @@ def parse_llm_ppt_response(response: str, layout_style: str = "consistent") -> l
                 continue
             # 제목 섹션 감지
-            if line.startswith('제목:') or line.startswith('Title:'):
                 current_part = 'title'
                 title_text = line.split(':', 1)[1].strip() if ':' in line else ''
-                if title_text:
-                    title_lines.append(title_text)
             # 내용 섹션 감지
             elif line.startswith('내용:') or line.startswith('Content:'):
                 current_part = 'content'
@@ -1173,57 +1193,91 @@ def parse_llm_ppt_response(response: str, layout_style: str = "consistent") -> l
                     notes_lines.append(notes_text)
             # 현재 섹션에 따라 내용 추가
             else:
-                if current_part == 'title' and not title_lines:
-                    title_lines.append(line)
                 elif current_part == 'content':
                     content_lines.append(line)
                 elif current_part == 'notes':
                     notes_lines.append(line)
-                elif not current_part and not title_lines:
                     # 첫 번째 줄을 제목으로
-                    title_lines.append(line)
-                    current_part = 'content'  # 이후 줄들은 content로
-                elif not current_part:
                     content_lines.append(line)
         # 슬라이드 데이터 설정
-        slide['title'] = ' '.join(title_lines).strip()
         slide['content'] = '\n'.join(content_lines).strip()
         slide['notes'] = ' '.join(notes_lines).strip()
-        # 제목 정리
-        slide['title'] = re.sub(r'^(슬라이드|Slide)\s*\d+\s*[:：\-]?\s*', '', slide['title'], flags=re.IGNORECASE)
-        slide['title'] = re.sub(r'^(제목|Title)\s*[:：]\s*', '', slide['title'], flags=re.IGNORECASE)
         # 내용이 있는 경우에만 추가
         if slide['title'] or slide['content']:
             logger.info(f"Slide {len(slides)+1}: Title='{slide['title'][:30]}...', Content length={len(slide['content'])}")
             slides.append(slide)
-    # 만약 위 방법으로 파싱이 안 되었다면, 더 간단한 방법 시도
-    if not slides:
-        logger.warning("Primary parsing failed, trying fallback method...")
-        # 더블 뉴라인으로 구분
-        sections = response.split('\n\n')
         for section in sections:
-            lines = section.strip().split('\n')
-            if len(lines) >= 2:  # 최소 제목과 내용이 있어야 함
-                slide = {
-                    'title': lines[0].strip(),
-                    'content': '\n'.join(lines[1:]).strip(),
-                    'notes': '',
-                    'layout': 'title_content',
-                    'chart_data': None
-                }
-                # 제목 정리
-                slide['title'] = re.sub(r'^(슬라이드|Slide)\s*\d+\s*[:：\-]?\s*', '', slide['title'], flags=re.IGNORECASE)
-                if slide['title'] and slide['content']:
-                    slides.append(slide)
     logger.info(f"Total slides parsed: {len(slides)}")
     return slides
 def force_font_size(text_frame, font_size_pt: int, theme: Dict):

 # PPT Generation Functions - FIXED VERSION
 ##############################################################################
 def parse_llm_ppt_response(response: str, layout_style: str = "consistent") -> list:
+    """Parse LLM response to extract slide content - FIXED VERSION"""
     slides = []
     logger.info(f"Parsing LLM response, total length: {len(response)}")
     logger.debug(f"First 500 chars: {response[:500]}")
     except:
         pass
+    # 더 정확한 슬라이드 구분 패턴
+    # "슬라이드 1", "슬라이드 2" 또는 "Slide 1", "Slide 2" 형식을 찾음
+    slide_markers = []
+    # 슬라이드 마커의 위치를 먼저 찾음
+    for match in re.finditer(r'^(?:슬라이드|Slide)\s*(\d+)\s*$', response, re.MULTILINE):
+        slide_markers.append({
+            'index': int(match.group(1)),
+            'start': match.start(),
+            'end': match.end()
+        })
+    logger.info(f"Found {len(slide_markers)} slide markers")
+    # 슬라이드 마커가 없으면 다른 패턴 시도
+    if not slide_markers:
+        # 숫자만으로 시작하는 패턴도 찾기 (예: "1.", "2." 등)
+        for match in re.finditer(r'^(\d+)[.)]\s*$', response, re.MULTILINE):
+            slide_markers.append({
+                'index': int(match.group(1)),
+                'start': match.start(),
+                'end': match.end()
+            })
+    # 각 슬라이드 마커 사이의 내용을 추출
+    for i, marker in enumerate(slide_markers):
+        # 현재 슬라이드의 시작과 끝 위치
+        start = marker['end']
+        if i < len(slide_markers) - 1:
+            end = slide_markers[i + 1]['start']
+        else:
+            end = len(response)
+        section = response[start:end].strip()
+        if not section:
             continue
+        logger.debug(f"Processing slide {marker['index']}: {section[:100]}...")
         slide = {
             'title': '',
         }
         # 섹션 내에서 제목, 내용, 노트 추출
+        lines = section.split('\n')
         current_part = None
+        title_found = False
         content_lines = []
         notes_lines = []
                 continue
             # 제목 섹션 감지
+            if (line.startswith('제목:') or line.startswith('Title:')) and not title_found:
                 current_part = 'title'
                 title_text = line.split(':', 1)[1].strip() if ':' in line else ''
+                slide['title'] = title_text
+                title_found = True
             # 내용 섹션 감지
             elif line.startswith('내용:') or line.startswith('Content:'):
                 current_part = 'content'
                     notes_lines.append(notes_text)
             # 현재 섹션에 따라 내용 추가
             else:
+                if current_part == 'title' and not slide['title']:
+                    slide['title'] = line
                 elif current_part == 'content':
                     content_lines.append(line)
                 elif current_part == 'notes':
                     notes_lines.append(line)
+                elif not title_found and not slide['title']:
                     # 첫 번째 줄을 제목으로
+                    slide['title'] = line
+                    title_found = True
+                    current_part = 'content'
+                elif current_part is None and title_found:
+                    current_part = 'content'
                     content_lines.append(line)
         # 슬라이드 데이터 설정
         slide['content'] = '\n'.join(content_lines).strip()
         slide['notes'] = ' '.join(notes_lines).strip()
         # 내용이 있는 경우에만 추가
         if slide['title'] or slide['content']:
             logger.info(f"Slide {len(slides)+1}: Title='{slide['title'][:30]}...', Content length={len(slide['content'])}")
             slides.append(slide)
+    # 만약 위 방법으로 파싱이 안 되었다면, 더 유연한 방법 시도
+    if not slides or len(slides) < 3:
+        logger.warning(f"Primary parsing resulted in only {len(slides)} slides, trying alternative method...")
+        slides = []
+        # "제목:" 패턴으로 슬라이드 구분 시도
+        sections = re.split(r'\n(?=제목:|Title:)', response)
         for section in sections:
+            if not section.strip():
+                continue
+            slide = {
+                'title': '',
+                'content': '',
+                'notes': '',
+                'layout': 'title_content',
+                'chart_data': None
+            }
+            lines = section.strip().split('\n')
+            current_part = None
+            content_lines = []
+            notes_lines = []
+            for line in lines:
+                line = line.strip()
+                if not line:
+                    continue
+                if line.startswith('제목:') or line.startswith('Title:'):
+                    slide['title'] = line.split(':', 1)[1].strip() if ':' in line else ''
+                    current_part = 'content'
+                elif line.startswith('내용:') or line.startswith('Content:'):
+                    current_part = 'content'
+                elif line.startswith('노트:') or line.startswith('Notes:'):
+                    current_part = 'notes'
+                    notes_text = line.split(':', 1)[1].strip() if ':' in line else ''
+                    if notes_text:
+                        notes_lines.append(notes_text)
+                elif current_part == 'content':
+                    content_lines.append(line)
+                elif current_part == 'notes':
+                    notes_lines.append(line)
+            slide['content'] = '\n'.join(content_lines).strip()
+            slide['notes'] = ' '.join(notes_lines).strip()
+            # 슬라이드 번호 제거
+            slide['title'] = re.sub(r'^(슬라이드|Slide)\s*\d+\s*[:：\-]?\s*', '', slide['title'], flags=re.IGNORECASE)
+            if slide['title'] or slide['content']:
+                slides.append(slide)
     logger.info(f"Total slides parsed: {len(slides)}")
+    # 파싱 결과 검증
+    if len(slides) < 3:
+        logger.error("Parsing resulted in too few slides. Raw response preview:")
+        logger.error(response[:1000])
     return slides
 def force_font_size(text_frame, font_size_pt: int, theme: Dict):