N_B_analysis-5

Sleeping

App Files Files Community

Kims12 commited on Feb 11

Commit

f8570dc

verified ·

1 Parent(s): f9c1fca

Update app.py

Browse files

Files changed (1) hide show

app.py +105 -128

app.py CHANGED Viewed

@@ -1,7 +1,5 @@
 import gradio as gr
 import requests
-import aiohttp
-import asyncio
 from bs4 import BeautifulSoup
 import urllib.parse  # iframe 경로 보정을 위한 모듈
 import re
@@ -19,8 +17,8 @@ import base64
 def debug_log(message: str):
     print(f"[DEBUG] {message}")
-# --- 네이버 블로그 스크래핑 (비동기 버전) ---
-async def scrape_naver_blog(url: str) -> str:
     debug_log("scrape_naver_blog 함수 시작")
     debug_log(f"요청받은 URL: {url}")
     headers = {
@@ -31,51 +29,75 @@ async def scrape_naver_blog(url: str) -> str:
         )
     }
     try:
-        async with aiohttp.ClientSession() as session:
-            async with session.get(url, headers=headers) as response:
-                debug_log("HTTP GET 요청(메인 페이지) 완료")
-                if response.status != 200:
-                    debug_log(f"요청 실패, 상태코드: {response.status}")
-                    return f"오류가 발생했습니다. 상태코드: {response.status}"
-                html = await response.text()
-                soup = BeautifulSoup(html, "html.parser")
-                debug_log("HTML 파싱(메인 페이지) 완료")
-                iframe = soup.select_one("iframe#mainFrame")
-                if not iframe:
-                    debug_log("iframe#mainFrame 태그를 찾을 수 없습니다.")
-                    return "본문 iframe을 찾을 수 없습니다."
-                iframe_src = iframe.get("src")
-                if not iframe_src:
-                    debug_log("iframe src가 존재하지 않습니다.")
-                    return "본문 iframe의 src를 찾을 수 없습니다."
-                parsed_iframe_url = urllib.parse.urljoin(url, iframe_src)
-                debug_log(f"iframe 페이지 요청 URL: {parsed_iframe_url}")
-            async with aiohttp.ClientSession() as session:
-                async with session.get(parsed_iframe_url, headers=headers) as iframe_response:
-                    debug_log("HTTP GET 요청(iframe 페이지) 완료")
-                    if iframe_response.status != 200:
-                        debug_log(f"iframe 요청 실패, 상태코드: {iframe_response.status}")
-                        return f"iframe에서 오류가 발생했습니다. 상태코드: {iframe_response.status}"
-                    iframe_html = await iframe_response.text()
-                    iframe_soup = BeautifulSoup(iframe_html, "html.parser")
-                    debug_log("HTML 파싱(iframe 페이지) 완료")
-                    title_div = iframe_soup.select_one('.se-module.se-module-text.se-title-text')
-                    title = title_div.get_text(strip=True) if title_div else "제목을 찾을 수 없습니다."
-                    debug_log(f"추출된 제목: {title}")
-                    content_div = iframe_soup.select_one('.se-main-container')
-                    if content_div:
-                        content = content_div.get_text("\n", strip=True)
-                    else:
-                        content = "본문을 찾을 수 없습니다."
-                    debug_log("본문 추출 완료")
-                    result = f"[제목]\n{title}\n\n[본문]\n{content}"
-                    debug_log("제목과 본문 합침 완료")
-                    return result
     except Exception as e:
         debug_log(f"에러 발생: {str(e)}")
         return f"스크래핑 중 오류가 발생했습니다: {str(e)}"
-# --- 네이버 검색 및 광고 API 관련 ---
 def generate_signature(timestamp, method, uri, secret_key):
     message = f"{timestamp}.{method}.{uri}"
     digest = hmac.new(secret_key.encode("utf-8"), message.encode("utf-8"), hashlib.sha256).digest()
@@ -92,8 +114,7 @@ def get_header(method, uri, api_key, secret_key, customer_id):
         "X-Signature": signature
     }
-# --- 연관 키워드 조회 (비동기) ---
-async def fetch_related_keywords(keyword):
     debug_log(f"fetch_related_keywords 호출, 키워드: {keyword}")
     API_KEY = os.environ["NAVER_API_KEY"]
     SECRET_KEY = os.environ["NAVER_SECRET_KEY"]
@@ -106,9 +127,8 @@ async def fetch_related_keywords(keyword):
         "hintKeywords": [keyword],
         "showDetail": "1"
     }
-    async with aiohttp.ClientSession() as session:
-        async with session.get(BASE_URL + uri, headers=headers, params=params) as response:
-            data = await response.json()
     if "keywordList" not in data:
         return pd.DataFrame()
     df = pd.DataFrame(data["keywordList"])
@@ -127,8 +147,7 @@ async def fetch_related_keywords(keyword):
     debug_log("fetch_related_keywords 완료")
     return result_df
-# --- 블로그 문서수 조회 (비동기) ---
-async def fetch_blog_count(keyword):
     debug_log(f"fetch_blog_count 호출, 키워드: {keyword}")
     client_id = os.environ["NAVER_SEARCH_CLIENT_ID"]
     client_secret = os.environ["NAVER_SEARCH_CLIENT_SECRET"]
@@ -138,30 +157,28 @@ async def fetch_blog_count(keyword):
         "X-Naver-Client-Secret": client_secret
     }
     params = {"query": keyword, "display": 1}
-    async with aiohttp.ClientSession() as session:
-        async with session.get(url, headers=headers, params=params) as response:
-            if response.status == 200:
-                data = await response.json()
-                debug_log(f"fetch_blog_count 결과: {data.get('total', 0)}")
-                return data.get("total", 0)
-            else:
-                debug_log(f"fetch_blog_count 오류, 상태코드: {response.status}")
-                return 0
 def create_excel_file(df):
     with tempfile.NamedTemporaryFile(suffix=".xlsx", delete=False) as tmp:
         excel_path = tmp.name
-    df.to_excel(excel_path, index=False, engine='openpyxl')
     debug_log(f"Excel 파일 생성됨: {excel_path}")
     return excel_path
-# --- 키워드 검색 (비동기) ---
-async def process_keyword(keywords: str, include_related: bool):
     debug_log(f"process_keyword 호출, 키워드들: {keywords}, 연관검색어 포함: {include_related}")
     input_keywords = [k.strip() for k in keywords.splitlines() if k.strip()]
     result_dfs = []
     for idx, kw in enumerate(input_keywords):
-        df_kw = await fetch_related_keywords(kw)
         if df_kw.empty:
             continue
         row_kw = df_kw[df_kw["정보키워드"] == kw]
@@ -178,44 +195,13 @@ async def process_keyword(keywords: str, include_related: bool):
         result_df.drop_duplicates(subset=["정보키워드"], inplace=True)
     else:
         result_df = pd.DataFrame(columns=["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"])
-    # 블로그 문서수 조회를 병렬로 처리
-    tasks = [fetch_blog_count(kw) for kw in result_df["정보키워드"]]
-    counts = await asyncio.gather(*tasks)
-    result_df["블로그문서수"] = counts
     result_df.sort_values(by="토탈월검색량", ascending=False, inplace=True)
     debug_log("process_keyword 완료")
     return result_df, create_excel_file(result_df)
-# --- 형태소 분석 (참고 코드-1, 동기) ---
-def analyze_text(text: str):
-    logging.basicConfig(level=logging.DEBUG)
-    logger = logging.getLogger(__name__)
-    logger.debug("원본 텍스트: %s", text)
-    filtered_text = re.sub(r'[^가-힣]', '', text)
-    logger.debug("필터링된 텍스트: %s", filtered_text)
-    if not filtered_text:
-        logger.debug("유효한 한국어 텍스트가 없음.")
-        return pd.DataFrame(columns=["단어", "빈도수"]), ""
-    mecab_instance = mecab.MeCab()
-    tokens = mecab_instance.pos(filtered_text)
-    logger.debug("형태소 분석 결과: %s", tokens)
-    freq = {}
-    for word, pos in tokens:
-        if word and word.strip() and pos.startswith("NN"):
-            freq[word] = freq.get(word, 0) + 1
-            logger.debug("단어: %s, 품사: %s, 빈도: %d", word, pos, freq[word])
-    sorted_freq = sorted(freq.items(), key=lambda x: x[1], reverse=True)
-    logger.debug("정렬된 단어 빈도: %s", sorted_freq)
-    df = pd.DataFrame(sorted_freq, columns=["단어", "빈도수"])
-    logger.debug("형태소 분석 DataFrame 생성됨, shape: %s", df.shape)
-    temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".xlsx")
-    df.to_excel(temp_file.name, index=False, engine='openpyxl')
-    temp_file.close()
-    logger.debug("Excel 파일 생성됨: %s", temp_file.name)
-    return df, temp_file.name
-# --- 형태소 분석과 검색량/블로그문서수 병합 (비동기) ---
-async def morphological_analysis_and_enrich(text: str, remove_freq1: bool):
     debug_log("morphological_analysis_and_enrich 함수 시작")
     df_freq, _ = analyze_text(text)
     if df_freq.empty:
@@ -227,7 +213,7 @@ async def morphological_analysis_and_enrich(text: str, remove_freq1: bool):
         debug_log(f"빈도수 1 제거 적용됨. {before_shape} -> {df_freq.shape}")
     keywords = "\n".join(df_freq["단어"].tolist())
     debug_log(f"분석된 키워드: {keywords}")
-    df_keyword_info, _ = await process_keyword(keywords, include_related=False)
     debug_log("검색량 및 블로그문서수 조회 완료")
     merged_df = pd.merge(df_freq, df_keyword_info, left_on="단어", right_on="정보키워드", how="left")
     merged_df.drop(columns=["정보키워드"], inplace=True)
@@ -235,8 +221,8 @@ async def morphological_analysis_and_enrich(text: str, remove_freq1: bool):
     debug_log("morphological_analysis_and_enrich 함수 완료")
     return merged_df, merged_excel_path
-# --- 직접 키워드 분석 (단독 분석, 비동기) ---
-async def direct_keyword_analysis(text: str, keyword_input: str):
     debug_log("direct_keyword_analysis 함수 시작")
     keywords = re.split(r'[\n,]+', keyword_input)
     keywords = [kw.strip() for kw in keywords if kw.strip()]
@@ -246,28 +232,15 @@ async def direct_keyword_analysis(text: str, keyword_input: str):
         count = text.count(kw)
         results.append((kw, count))
         debug_log(f"키워드 '{kw}'의 빈도수: {count}")
-        # 직접 입력 키워드가 본문에 없으면 추가 조회
-        if kw not in text:
-            df_direct, _ = await process_keyword(kw, include_related=False)
-            if (not df_direct.empty) and (kw in df_direct["정보키워드"].values):
-                row = df_direct[df_direct["정보키워드"] == kw].iloc[0]
-                pc = row.get("PC월검색량", None)
-                mobile = row.get("모바일월검색량", None)
-                total = row.get("토탈월검색량", None)
-                blog_count = row.get("블로그문서수", None)
-            else:
-                pc = mobile = total = blog_count = None
-            # 결과에 새 행 추가
-            results.append((kw, count))
     df = pd.DataFrame(results, columns=["키워드", "빈도수"])
     excel_path = create_excel_file(df)
     debug_log("direct_keyword_analysis 함수 완료")
     return df, excel_path
-# --- 통합 분석 (형태소 분석 + 직접 키워드 분석, 비동기) ---
-async def combined_analysis(blog_text: str, remove_freq1: bool, direct_keyword_input: str):
     debug_log("combined_analysis 함수 시작")
-    merged_df, _ = await morphological_analysis_and_enrich(blog_text, remove_freq1)
     if "직접입력" not in merged_df.columns:
         merged_df["직접입력"] = ""
     direct_keywords = re.split(r'[\n,]+', direct_keyword_input)
@@ -278,7 +251,7 @@ async def combined_analysis(blog_text: str, remove_freq1: bool, direct_keyword_i
             merged_df.loc[merged_df["단어"] == dk, "직접입력"] = "직접입력"
         else:
             freq = blog_text.count(dk)
-            df_direct, _ = await process_keyword(dk, include_related=False)
             if (not df_direct.empty) and (dk in df_direct["정보키워드"].values):
                 row = df_direct[df_direct["정보키워드"] == dk].iloc[0]
                 pc = row.get("PC월검색량", None)
@@ -302,18 +275,20 @@ async def combined_analysis(blog_text: str, remove_freq1: bool, direct_keyword_i
     debug_log("combined_analysis 함수 완료")
     return merged_df, combined_excel
-# --- 분석 핸들러 (비동기) ---
-async def analysis_handler(blog_text: str, remove_freq1: bool, direct_keyword_input: str, direct_keyword_only: bool):
     debug_log("analysis_handler 함수 시작")
     if direct_keyword_only:
-        return await direct_keyword_analysis(blog_text, direct_keyword_input)
     else:
-        return await combined_analysis(blog_text, remove_freq1, direct_keyword_input)
-# --- 스크래핑 실행 핸들러 (비동기) ---
-async def fetch_blog_content(url: str):
     debug_log("fetch_blog_content 함수 시작")
-    content = await scrape_naver_blog(url)
     debug_log("fetch_blog_content 함수 완료")
     return content
@@ -399,6 +374,7 @@ custom_css = """
 # --- Gradio 인터페이스 구성 ---
 with gr.Blocks(title="네이버 블로그 형태소 분석 서비스", css=custom_css) as demo:
     gr.HTML("<div class='custom-header'>네이버 블로그 형태소 분석 서비스 🚀</div>")
     with gr.Group(elem_classes="custom-group"):
         with gr.Row():
             blog_url_input = gr.Textbox(label="네이버 블로그 링크", placeholder="예: https://blog.naver.com/ssboost/222983068507", lines=1)
@@ -420,6 +396,7 @@ with gr.Blocks(title="네이버 블로그 형태소 분석 서비스", css=custo
         result_df = gr.Dataframe(label="통합 분석 결과 (단어, 빈도수, 검색량, 블로그문서수, 직접입력)", interactive=True)
     with gr.Group(elem_classes="custom-group"):
         excel_file = gr.File(label="Excel 다운로드")
     with gr.Group(elem_classes="custom-group"):
         usage_html = gr.HTML("""
         <div class="usage-instructions">
@@ -441,7 +418,7 @@ with gr.Blocks(title="네이버 블로그 형태소 분석 서비스", css=custo
             <p><strong>Tip:</strong> 분석 결과는 실시간으로 업데이트되며, 필요시 수정 후 다시 분석할 수 있습니다. 즐거운 분석 되세요! 😊</p>
         </div>
         """)
-    # 이벤트 연결 (비동기 함수 사용)
     scrape_button.click(fn=fetch_blog_content, inputs=blog_url_input, outputs=blog_content_box)
     analyze_button.click(fn=analysis_handler,
                          inputs=[blog_content_box, remove_freq_checkbox, direct_keyword_box, direct_keyword_only_checkbox],
@@ -450,4 +427,4 @@ with gr.Blocks(title="네이버 블로그 형태소 분석 서비스", css=custo
 if __name__ == "__main__":
     debug_log("Gradio 앱 실행 시작")
     demo.launch()
-    debug_log("Gradio 앱 실행 종료")

 import gradio as gr
 import requests
 from bs4 import BeautifulSoup
 import urllib.parse  # iframe 경로 보정을 위한 모듈
 import re
 def debug_log(message: str):
     print(f"[DEBUG] {message}")
+# --- 네이버 블로그 스크래핑 ---
+def scrape_naver_blog(url: str) -> str:
     debug_log("scrape_naver_blog 함수 시작")
     debug_log(f"요청받은 URL: {url}")
     headers = {
         )
     }
     try:
+        response = requests.get(url, headers=headers)
+        debug_log("HTTP GET 요청(메인 페이지) 완료")
+        if response.status_code != 200:
+            debug_log(f"요청 실패, 상태코드: {response.status_code}")
+            return f"오류가 발생했습니다. 상태코드: {response.status_code}"
+        soup = BeautifulSoup(response.text, "html.parser")
+        debug_log("HTML 파싱(메인 페이지) 완료")
+        iframe = soup.select_one("iframe#mainFrame")
+        if not iframe:
+            debug_log("iframe#mainFrame 태그를 찾을 수 없습니다.")
+            return "본문 iframe을 찾을 수 없습니다."
+        iframe_src = iframe.get("src")
+        if not iframe_src:
+            debug_log("iframe src가 존재하지 않습니다.")
+            return "본문 iframe의 src를 찾을 수 없습니다."
+        parsed_iframe_url = urllib.parse.urljoin(url, iframe_src)
+        debug_log(f"iframe 페이지 요청 URL: {parsed_iframe_url}")
+        iframe_response = requests.get(parsed_iframe_url, headers=headers)
+        debug_log("HTTP GET 요청(iframe 페이지) 완료")
+        if iframe_response.status_code != 200:
+            debug_log(f"iframe 요청 실패, 상태코드: {iframe_response.status_code}")
+            return f"iframe에서 오류가 발생했습니다. 상태코드: {iframe_response.status_code}"
+        iframe_soup = BeautifulSoup(iframe_response.text, "html.parser")
+        debug_log("HTML 파싱(iframe 페이지) 완료")
+        title_div = iframe_soup.select_one('.se-module.se-module-text.se-title-text')
+        title = title_div.get_text(strip=True) if title_div else "��목을 찾을 수 없습니다."
+        debug_log(f"추출된 제목: {title}")
+        content_div = iframe_soup.select_one('.se-main-container')
+        if content_div:
+            content = content_div.get_text("\n", strip=True)
+        else:
+            content = "본문을 찾을 수 없습니다."
+        debug_log("본문 추출 완료")
+        result = f"[제목]\n{title}\n\n[본문]\n{content}"
+        debug_log("제목과 본문 합침 완료")
+        return result
     except Exception as e:
         debug_log(f"에러 발생: {str(e)}")
         return f"스크래핑 중 오류가 발생했습니다: {str(e)}"
+# --- 형태소 분석 (참조코드-1) ---
+def analyze_text(text: str):
+    logging.basicConfig(level=logging.DEBUG)
+    logger = logging.getLogger(__name__)
+    logger.debug("원본 텍스트: %s", text)
+    filtered_text = re.sub(r'[^가-힣]', '', text)
+    logger.debug("필터링된 텍스트: %s", filtered_text)
+    if not filtered_text:
+        logger.debug("유효한 한국어 텍스트가 없음.")
+        return pd.DataFrame(columns=["단어", "빈도수"]), ""
+    mecab_instance = mecab.MeCab()
+    tokens = mecab_instance.pos(filtered_text)
+    logger.debug("형태소 분석 결과: %s", tokens)
+    freq = {}
+    for word, pos in tokens:
+        if word and word.strip() and pos.startswith("NN"):
+            freq[word] = freq.get(word, 0) + 1
+            logger.debug("단어: %s, 품사: %s, 빈도: %d", word, pos, freq[word])
+    sorted_freq = sorted(freq.items(), key=lambda x: x[1], reverse=True)
+    logger.debug("정렬된 단어 빈도: %s", sorted_freq)
+    df = pd.DataFrame(sorted_freq, columns=["단어", "빈도수"])
+    logger.debug("형태소 분석 DataFrame 생성됨, shape: %s", df.shape)
+    temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".xlsx")
+    df.to_excel(temp_file.name, index=False, engine='openpyxl')
+    temp_file.close()
+    logger.debug("Excel 파일 생성됨: %s", temp_file.name)
+    return df, temp_file.name
+# --- 네이버 검색 및 광고 API 관련 (참조코드-2) ---
 def generate_signature(timestamp, method, uri, secret_key):
     message = f"{timestamp}.{method}.{uri}"
     digest = hmac.new(secret_key.encode("utf-8"), message.encode("utf-8"), hashlib.sha256).digest()
         "X-Signature": signature
     }
+def fetch_related_keywords(keyword):
     debug_log(f"fetch_related_keywords 호출, 키워드: {keyword}")
     API_KEY = os.environ["NAVER_API_KEY"]
     SECRET_KEY = os.environ["NAVER_SECRET_KEY"]
         "hintKeywords": [keyword],
         "showDetail": "1"
     }
+    response = requests.get(BASE_URL + uri, params=params, headers=headers)
+    data = response.json()
     if "keywordList" not in data:
         return pd.DataFrame()
     df = pd.DataFrame(data["keywordList"])
     debug_log("fetch_related_keywords 완료")
     return result_df
+def fetch_blog_count(keyword):
     debug_log(f"fetch_blog_count 호출, 키워드: {keyword}")
     client_id = os.environ["NAVER_SEARCH_CLIENT_ID"]
     client_secret = os.environ["NAVER_SEARCH_CLIENT_SECRET"]
         "X-Naver-Client-Secret": client_secret
     }
     params = {"query": keyword, "display": 1}
+    response = requests.get(url, headers=headers, params=params)
+    if response.status_code == 200:
+        data = response.json()
+        debug_log(f"fetch_blog_count 결과: {data.get('total', 0)}")
+        return data.get("total", 0)
+    else:
+        debug_log(f"fetch_blog_count 오류, 상태코드: {response.status_code}")
+        return 0
 def create_excel_file(df):
     with tempfile.NamedTemporaryFile(suffix=".xlsx", delete=False) as tmp:
         excel_path = tmp.name
+    df.to_excel(excel_path, index=False)
     debug_log(f"Excel 파일 생성됨: {excel_path}")
     return excel_path
+def process_keyword(keywords: str, include_related: bool):
     debug_log(f"process_keyword 호출, 키워드들: {keywords}, 연관검색어 포함: {include_related}")
     input_keywords = [k.strip() for k in keywords.splitlines() if k.strip()]
     result_dfs = []
     for idx, kw in enumerate(input_keywords):
+        df_kw = fetch_related_keywords(kw)
         if df_kw.empty:
             continue
         row_kw = df_kw[df_kw["정보키워드"] == kw]
         result_df.drop_duplicates(subset=["정보키워드"], inplace=True)
     else:
         result_df = pd.DataFrame(columns=["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"])
+    result_df["블로그문서수"] = result_df["정보키워드"].apply(fetch_blog_count)
     result_df.sort_values(by="토탈월검색량", ascending=False, inplace=True)
     debug_log("process_keyword 완료")
     return result_df, create_excel_file(result_df)
+# --- 형태소 분석과 검색량/블로그문서수 병합 ---
+def morphological_analysis_and_enrich(text: str, remove_freq1: bool):
     debug_log("morphological_analysis_and_enrich 함수 시작")
     df_freq, _ = analyze_text(text)
     if df_freq.empty:
         debug_log(f"빈도수 1 제거 적용됨. {before_shape} -> {df_freq.shape}")
     keywords = "\n".join(df_freq["단어"].tolist())
     debug_log(f"분석된 키워드: {keywords}")
+    df_keyword_info, _ = process_keyword(keywords, include_related=False)
     debug_log("검색량 및 블로그문서수 조회 완료")
     merged_df = pd.merge(df_freq, df_keyword_info, left_on="단어", right_on="정보키워드", how="left")
     merged_df.drop(columns=["정보키워드"], inplace=True)
     debug_log("morphological_analysis_and_enrich 함수 완료")
     return merged_df, merged_excel_path
+# --- 직접 키워드 분석 (단독 분석) ---
+def direct_keyword_analysis(text: str, keyword_input: str):
     debug_log("direct_keyword_analysis 함수 시작")
     keywords = re.split(r'[\n,]+', keyword_input)
     keywords = [kw.strip() for kw in keywords if kw.strip()]
         count = text.count(kw)
         results.append((kw, count))
         debug_log(f"키워드 '{kw}'의 빈도수: {count}")
     df = pd.DataFrame(results, columns=["키워드", "빈도수"])
     excel_path = create_excel_file(df)
     debug_log("direct_keyword_analysis 함수 완료")
     return df, excel_path
+# --- 통합 분석 (형태소 분석 + 직접 키워드 분석) ---
+def combined_analysis(blog_text: str, remove_freq1: bool, direct_keyword_input: str):
     debug_log("combined_analysis 함수 시작")
+    merged_df, _ = morphological_analysis_and_enrich(blog_text, remove_freq1)
     if "직접입력" not in merged_df.columns:
         merged_df["직접입력"] = ""
     direct_keywords = re.split(r'[\n,]+', direct_keyword_input)
             merged_df.loc[merged_df["단어"] == dk, "직접입력"] = "직접입력"
         else:
             freq = blog_text.count(dk)
+            df_direct, _ = process_keyword(dk, include_related=False)
             if (not df_direct.empty) and (dk in df_direct["정보키워드"].values):
                 row = df_direct[df_direct["정보키워드"] == dk].iloc[0]
                 pc = row.get("PC월검색량", None)
     debug_log("combined_analysis 함수 완료")
     return merged_df, combined_excel
+# --- 분석 핸들러 ---
+def analysis_handler(blog_text: str, remove_freq1: bool, direct_keyword_input: str, direct_keyword_only: bool):
     debug_log("analysis_handler 함수 시작")
     if direct_keyword_only:
+        # "직접 키워드 입력만 분석" 선택 시 단독 분석 수행
+        return direct_keyword_analysis(blog_text, direct_keyword_input)
     else:
+        # 기본 통합 분석 수행
+        return combined_analysis(blog_text, remove_freq1, direct_keyword_input)
+# --- 스크래핑 실행 ---
+def fetch_blog_content(url: str):
     debug_log("fetch_blog_content 함수 시작")
+    content = scrape_naver_blog(url)
     debug_log("fetch_blog_content 함수 완료")
     return content
 # --- Gradio 인터페이스 구성 ---
 with gr.Blocks(title="네이버 블로그 형태소 분석 서비스", css=custom_css) as demo:
     gr.HTML("<div class='custom-header'>네이버 블로그 형태소 분석 서비스 🚀</div>")
+    # 블로그 링크와 스크래핑 실행 버튼을 한 그룹 내에 배치 (버튼은 가운데 정렬)
     with gr.Group(elem_classes="custom-group"):
         with gr.Row():
             blog_url_input = gr.Textbox(label="네이버 블로그 링크", placeholder="예: https://blog.naver.com/ssboost/222983068507", lines=1)
         result_df = gr.Dataframe(label="통합 분석 결과 (단어, 빈도수, 검색량, 블로그문서수, 직접입력)", interactive=True)
     with gr.Group(elem_classes="custom-group"):
         excel_file = gr.File(label="Excel 다운로드")
+    # 사용설명 HTML 블록 (아래에 배치)
     with gr.Group(elem_classes="custom-group"):
         usage_html = gr.HTML("""
         <div class="usage-instructions">
             <p><strong>Tip:</strong> 분석 결과는 실시간으로 업데이트되며, 필요시 수정 후 다시 분석할 수 있습니다. 즐거운 분석 되세요! 😊</p>
         </div>
         """)
+    # 이벤트 연결
     scrape_button.click(fn=fetch_blog_content, inputs=blog_url_input, outputs=blog_content_box)
     analyze_button.click(fn=analysis_handler,
                          inputs=[blog_content_box, remove_freq_checkbox, direct_keyword_box, direct_keyword_only_checkbox],
 if __name__ == "__main__":
     debug_log("Gradio 앱 실행 시작")
     demo.launch()
+    debug_log("Gradio 앱 실행 종료")