Spaces:
Sleeping
Sleeping
| import gradio as gr | |
| import pandas as pd | |
| import logging | |
| from io import BytesIO | |
| import tempfile | |
| import os | |
| # 로그 설정 | |
| logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s') | |
| def analyze_reviews(file): | |
| logging.info("파일 업로드 시작") | |
| try: | |
| # 바이너리 데이터를 BytesIO로 변환 | |
| file_bytes = BytesIO(file) | |
| # 엑셀 파일 읽기 | |
| df = pd.read_excel(file_bytes, engine='openpyxl') | |
| logging.info("엑셀 파일 읽기 완료") | |
| except Exception as e: | |
| logging.error(f"엑셀 파일 읽기 오류: {e}") | |
| return f"엑셀 파일을 읽는 중 오류가 발생했습니다: {e}" | |
| try: | |
| # 현재 기준 연도 설정 (2025년 기준) | |
| current_year = 2025 | |
| start_year = current_year - 3 # 최근 3년 | |
| logging.info("리뷰 날짜 처리 시작") | |
| # B열에 있는 리뷰 날짜를 datetime 형식으로 변환 | |
| df['리뷰날짜'] = pd.to_datetime(df.iloc[:, 1], errors='coerce') | |
| # 연도 및 월 필터링 | |
| df_filtered = df[(df['리뷰날짜'].dt.year >= start_year) & (df['리뷰날짜'].dt.year < current_year)] | |
| logging.info("리뷰 날짜 필터링 완료") | |
| # 년월별 리뷰 건수 집계 | |
| logging.info("년월별 리뷰 건수 집계 시작") | |
| df_filtered['년월'] = df_filtered['리뷰날짜'].dt.strftime('%Y-%m') | |
| review_counts = df_filtered.groupby('년월').size().reset_index(name='리뷰건수') | |
| logging.info("년월별 리뷰 건수 집계 완료") | |
| # 새로운 시트에 데이터 작성 | |
| logging.info("새로운 시트 생성 및 데이터 작성 시작") | |
| # 기존 시트를 유지하면서 새로운 시트를 추가하기 위해 전체 시트를 읽고 다시 씁니다 | |
| file_bytes.seek(0) | |
| with pd.ExcelWriter(file_bytes, engine='openpyxl', mode='a', if_sheet_exists='replace') as writer: | |
| review_counts.to_excel(writer, sheet_name='월별 리뷰건수', index=False, columns=['년월', '리뷰건수']) | |
| logging.info("새로운 시트에 데이터 작성 완료") | |
| # 결과 파일 저장 | |
| logging.info("결과 파일 저장 시작") | |
| output = BytesIO() | |
| file_bytes.seek(0) # 원본 파일 포인터 초기화 | |
| with pd.ExcelWriter(output, engine='openpyxl') as writer: | |
| # 모든 시트 복사 | |
| with pd.ExcelFile(file_bytes) as xls: | |
| for sheet_name in xls.sheet_names: | |
| df_sheet = pd.read_excel(xls, sheet_name=sheet_name, engine='openpyxl') | |
| df_sheet.to_excel(writer, sheet_name=sheet_name, index=False) | |
| output.seek(0) | |
| logging.info("결과 파일 저장 완료") | |
| # 임시 파일 생성 | |
| with tempfile.NamedTemporaryFile(delete=False, suffix=".xlsx", prefix="분석된_리뷰_") as tmp_file: | |
| tmp_file.write(output.getvalue()) | |
| temp_file_path = tmp_file.name | |
| logging.info(f"임시 파일 생성 완료: {temp_file_path}") | |
| return temp_file_path # 파일 경로 반환 | |
| except Exception as e: | |
| logging.error(f"분석 과정 중 오류: {e}") | |
| return f"분석 과정에서 오류가 발생했습니다: {e}" | |
| # Gradio 인터페이스 구성 | |
| with gr.Blocks() as demo: | |
| gr.Markdown("## 리뷰 분석 스페이스") | |
| with gr.Row(): | |
| file_input = gr.File(label="원본 엑셀 파일 업로드", type="binary") | |
| analyze_button = gr.Button("분석") | |
| output_download = gr.File(label="분석된 엑셀 파일 다운로드", type="filepath") # type을 'filepath'로 설정 | |
| analyze_button.click(fn=analyze_reviews, inputs=file_input, outputs=output_download) | |
| # 스페이스 실행 | |
| if __name__ == "__main__": | |
| demo.launch() | |