Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -4,6 +4,11 @@ import gradio as gr
|
|
4 |
import openpyxl
|
5 |
from openpyxl.drawing.image import Image # 이미지 삽입을 위한 모듈
|
6 |
import os # 경로 확인 및 생성용
|
|
|
|
|
|
|
|
|
|
|
7 |
|
8 |
def extract_keywords(file):
|
9 |
# 엑셀 파일 읽기
|
@@ -19,7 +24,8 @@ def extract_keywords(file):
|
|
19 |
|
20 |
for name in product_names:
|
21 |
if pd.notna(name): # NaN 값 체크
|
22 |
-
|
|
|
23 |
keywords.extend(words)
|
24 |
|
25 |
# 키워드 빈도수 계산
|
@@ -41,7 +47,8 @@ def extract_keywords(file):
|
|
41 |
|
42 |
# 새로운 엑셀 파일 생성 및 이미지 삽입
|
43 |
with pd.ExcelWriter(output_path, engine='openpyxl') as writer:
|
44 |
-
|
|
|
45 |
workbook = writer.book
|
46 |
worksheet = workbook.active
|
47 |
|
|
|
4 |
import openpyxl
|
5 |
from openpyxl.drawing.image import Image # 이미지 삽입을 위한 모듈
|
6 |
import os # 경로 확인 및 생성용
|
7 |
+
import re # 특수문자 제거를 위한 정규식 사용
|
8 |
+
|
9 |
+
def clean_text(text):
|
10 |
+
# 정규식을 사용하여 특수문자를 제거하되, '-'는 제외
|
11 |
+
return re.sub(r'[^\w\s-]', '', text)
|
12 |
|
13 |
def extract_keywords(file):
|
14 |
# 엑셀 파일 읽기
|
|
|
24 |
|
25 |
for name in product_names:
|
26 |
if pd.notna(name): # NaN 값 체크
|
27 |
+
clean_name = clean_text(name) # 특수문자 제거
|
28 |
+
words = clean_name.split(" ") # 공백 기준으로 단어 분리
|
29 |
keywords.extend(words)
|
30 |
|
31 |
# 키워드 빈도수 계산
|
|
|
47 |
|
48 |
# 새로운 엑셀 파일 생성 및 이미지 삽입
|
49 |
with pd.ExcelWriter(output_path, engine='openpyxl') as writer:
|
50 |
+
# 엑셀의 첫 3줄을 비워두기 위해 행 인덱스를 3칸 내림
|
51 |
+
result_df.to_excel(writer, index=False, startrow=3)
|
52 |
workbook = writer.book
|
53 |
worksheet = workbook.active
|
54 |
|