aliceblue11 commited on
Commit
a5df267
·
verified ·
1 Parent(s): a7a856a

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +9 -2
app.py CHANGED
@@ -4,6 +4,11 @@ import gradio as gr
4
  import openpyxl
5
  from openpyxl.drawing.image import Image # 이미지 삽입을 위한 모듈
6
  import os # 경로 확인 및 생성용
 
 
 
 
 
7
 
8
  def extract_keywords(file):
9
  # 엑셀 파일 읽기
@@ -19,7 +24,8 @@ def extract_keywords(file):
19
 
20
  for name in product_names:
21
  if pd.notna(name): # NaN 값 체크
22
- words = name.split(" ") # 공백 기준으로 단어 분리
 
23
  keywords.extend(words)
24
 
25
  # 키워드 빈도수 계산
@@ -41,7 +47,8 @@ def extract_keywords(file):
41
 
42
  # 새로운 엑셀 파일 생성 및 이미지 삽입
43
  with pd.ExcelWriter(output_path, engine='openpyxl') as writer:
44
- result_df.to_excel(writer, index=False)
 
45
  workbook = writer.book
46
  worksheet = workbook.active
47
 
 
4
  import openpyxl
5
  from openpyxl.drawing.image import Image # 이미지 삽입을 위한 모듈
6
  import os # 경로 확인 및 생성용
7
+ import re # 특수문자 제거를 위한 정규식 사용
8
+
9
+ def clean_text(text):
10
+ # 정규식을 사용하여 특수문자를 제거하되, '-'는 제외
11
+ return re.sub(r'[^\w\s-]', '', text)
12
 
13
  def extract_keywords(file):
14
  # 엑셀 파일 읽기
 
24
 
25
  for name in product_names:
26
  if pd.notna(name): # NaN 값 체크
27
+ clean_name = clean_text(name) # 특수문자 제거
28
+ words = clean_name.split(" ") # 공백 기준으로 단어 분리
29
  keywords.extend(words)
30
 
31
  # 키워드 빈도수 계산
 
47
 
48
  # 새로운 엑셀 파일 생성 및 이미지 삽입
49
  with pd.ExcelWriter(output_path, engine='openpyxl') as writer:
50
+ # 엑셀의 첫 3줄을 비워두기 위해 행 인덱스를 3칸 내림
51
+ result_df.to_excel(writer, index=False, startrow=3)
52
  workbook = writer.book
53
  worksheet = workbook.active
54