Spaces:

aliceblue11
/

Keyword_Analysis

Sleeping

aliceblue11 commited on Aug 21, 2024

Commit

a5df267

verified ·

1 Parent(s): a7a856a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,6 +4,11 @@ import gradio as gr
 import openpyxl
 from openpyxl.drawing.image import Image  # 이미지 삽입을 위한 모듈
 import os  # 경로 확인 및 생성용
 def extract_keywords(file):
     # 엑셀 파일 읽기
@@ -19,7 +24,8 @@ def extract_keywords(file):
     for name in product_names:
         if pd.notna(name):  # NaN 값 체크
-            words = name.split(" ")  # 공백 기준으로 단어 분리
             keywords.extend(words)
     # 키워드 빈도수 계산
@@ -41,7 +47,8 @@ def extract_keywords(file):
     # 새로운 엑셀 파일 생성 및 이미지 삽입
     with pd.ExcelWriter(output_path, engine='openpyxl') as writer:
-        result_df.to_excel(writer, index=False)
         workbook = writer.book
         worksheet = workbook.active

 import openpyxl
 from openpyxl.drawing.image import Image  # 이미지 삽입을 위한 모듈
 import os  # 경로 확인 및 생성용
+import re  # 특수문자 제거를 위한 정규식 사용
+def clean_text(text):
+    # 정규식을 사용하여 특수문자를 제거하되, '-'는 제외
+    return re.sub(r'[^\w\s-]', '', text)
 def extract_keywords(file):
     # 엑셀 파일 읽기
     for name in product_names:
         if pd.notna(name):  # NaN 값 체크
+            clean_name = clean_text(name)  # 특수문자 제거
+            words = clean_name.split(" ")  # 공백 기준으로 단어 분리
             keywords.extend(words)
     # 키워드 빈도수 계산
     # 새로운 엑셀 파일 생성 및 이미지 삽입
     with pd.ExcelWriter(output_path, engine='openpyxl') as writer:
+        # 엑셀의 첫 3줄을 비워두기 위해 행 인덱스를 3칸 내림
+        result_df.to_excel(writer, index=False, startrow=3)
         workbook = writer.book
         worksheet = workbook.active