N_B_analysis-4

Sleeping

App Files Files Community

Kims12 commited on Feb 13

Commit

fdac880

verified ·

1 Parent(s): 989a45c

Update app.py

Browse files

Files changed (1) hide show

app.py +40 -7

app.py CHANGED Viewed

@@ -265,7 +265,32 @@ def morphological_analysis_and_enrich(text: str, remove_freq1: bool):
     debug_log("morphological_analysis_and_enrich 함수 완료")
     return merged_df, merged_excel_path
-# 새롭게 추가된 기능: 입력한 블로그 링크로부터 스크래핑하여 수정 가능한 텍스트 박스에 출력
 def fetch_blog_content(url: str):
     debug_log("fetch_blog_content 함수 시작")
     content = scrape_naver_blog(url)
@@ -277,23 +302,31 @@ with gr.Blocks(title="네이버 블로그 형태소 분석 스페이스", css=".
     gr.Markdown("# 네이버 블로그 형태소 분석 스페이스")
     with gr.Row():
         blog_url_input = gr.Textbox(label="네이버 블로그 링크", placeholder="예: https://blog.naver.com/ssboost/222983068507", lines=1)
-    with gr.Row():
         scrape_button = gr.Button("스크래핑 실행")
     with gr.Row():
         blog_content_box = gr.Textbox(label="블로그 내용 (수정 가능)", lines=10, placeholder="스크래핑된 블로그 내용이 여기에 표시됩니다.")
     with gr.Row():
         remove_freq_checkbox = gr.Checkbox(label="빈도수1 제거", value=False)
     with gr.Row():
         analyze_button = gr.Button("분석 실행")
     with gr.Row():
-        analysis_result = gr.Dataframe(label="분석 결과 (단어, 빈도수, 검색량, 블로그문서수 등)")
     with gr.Row():
-        analysis_excel = gr.File(label="Excel 다운로드")
-    # 스크래핑 실행 시 URL로부터 블로그 본문 스크래핑 후 수정 가능한 텍스트 박스에 출력
     scrape_button.click(fn=fetch_blog_content, inputs=blog_url_input, outputs=blog_content_box)
-    # 분석 실행 시 수정된 블로그 내용을 대상으로 형태소 분석 및 검색량/블로그문서수 조회 진행
-    analyze_button.click(fn=morphological_analysis_and_enrich, inputs=[blog_content_box, remove_freq_checkbox], outputs=[analysis_result, analysis_excel])
 if __name__ == "__main__":
     debug_log("Gradio 앱 실행 시작")

     debug_log("morphological_analysis_and_enrich 함수 완료")
     return merged_df, merged_excel_path
+# 새롭게 추가된 기능 1,2,3: 직접 입력한 키워드(엔터 또는 ','로 구분된 다수의 키워드)가 블로그 본문 내 등장 빈도수를 체크
+def direct_keyword_analysis(text: str, keyword_input: str):
+    debug_log("direct_keyword_analysis 함수 시작")
+    # 엔터 또는 쉼표로 분리하여 키워드 목록 생성
+    keywords = re.split(r'[\n,]+', keyword_input)
+    keywords = [kw.strip() for kw in keywords if kw.strip()]
+    debug_log(f"입력된 키워드 목록: {keywords}")
+    results = []
+    for kw in keywords:
+        count = text.count(kw)
+        results.append((kw, count))
+        debug_log(f"키워드 '{kw}'의 빈도수: {count}")
+    df = pd.DataFrame(results, columns=["키워드", "빈도수"])
+    excel_path = create_excel_file(df)
+    debug_log("direct_keyword_analysis 함수 완료")
+    return df, excel_path
+# 분석 실행 버튼 클릭 시, 수정 가능한 블로그 본문을 대상으로 형태소 분석과 직접 키워드 분석을 함께 진행
+def analyze_combined(blog_text: str, remove_freq1: bool, keyword_input: str):
+    debug_log("analyze_combined 함수 시작")
+    morph_df, morph_excel = morphological_analysis_and_enrich(blog_text, remove_freq1)
+    direct_df, direct_excel = direct_keyword_analysis(blog_text, keyword_input)
+    debug_log("analyze_combined 함수 완료")
+    return morph_df, morph_excel, direct_df, direct_excel
+# 스크래핑 실행: 블로그 링크를 통해 내용을 가져와 수정 가능한 텍스트 박스에 출력
 def fetch_blog_content(url: str):
     debug_log("fetch_blog_content 함수 시작")
     content = scrape_naver_blog(url)
     gr.Markdown("# 네이버 블로그 형태소 분석 스페이스")
     with gr.Row():
         blog_url_input = gr.Textbox(label="네이버 블로그 링크", placeholder="예: https://blog.naver.com/ssboost/222983068507", lines=1)
         scrape_button = gr.Button("스크래핑 실행")
     with gr.Row():
         blog_content_box = gr.Textbox(label="블로그 내용 (수정 가능)", lines=10, placeholder="스크래핑된 블로그 내용이 여기에 표시됩니다.")
     with gr.Row():
         remove_freq_checkbox = gr.Checkbox(label="빈도수1 제거", value=False)
+    with gr.Row():
+        keyword_input_box = gr.Textbox(label="직접 키워드 입력 (엔터 또는 ','로 구분)", lines=2, placeholder="예: 키워드1, 키워드2\n키워드3")
     with gr.Row():
         analyze_button = gr.Button("분석 실행")
+    gr.Markdown("### 형태소 분석 결과")
     with gr.Row():
+        morph_result_df = gr.Dataframe(label="형태소 분석 결과 (단어, 빈도수, 검색량, 블로그문서수 등)")
+        morph_excel_file = gr.File(label="형태소 분석 Excel 다운로드")
+    gr.Markdown("### 직접 키워드 분석 결과")
     with gr.Row():
+        direct_result_df = gr.Dataframe(label="직접 키워드 분석 결과 (키워드, 빈도수)")
+        direct_excel_file = gr.File(label="직접 키워드 분석 Excel 다운로드")
+    # 스크래핑 실행: URL을 입력하면 블로그 내용을 수정 가능한 텍스트 박스에 채워줌
     scrape_button.click(fn=fetch_blog_content, inputs=blog_url_input, outputs=blog_content_box)
+    # 분석 실행: 수정된 블로그 내용과 빈도수1 제거 옵션, 직접 입력 키워드를 대상으로 두 분석을 함께 진행
+    analyze_button.click(fn=analyze_combined, inputs=[blog_content_box, remove_freq_checkbox, keyword_input_box],
+                          outputs=[morph_result_df, morph_excel_file, direct_result_df, direct_excel_file])
 if __name__ == "__main__":
     debug_log("Gradio 앱 실행 시작")