Kims12's picture
Update app.py
99eadfa verified
raw
history blame
2.41 kB
import gradio as gr
import pandas as pd
import logging
from datetime import datetime
import os
# 로깅 설정
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
def analyze_reviews(file_path):
try:
logging.info("파일 업로드 시작: %s", file_path)
# 엑셀 파일 읽기
df = pd.read_excel(file_path)
logging.info("엑셀 파일 읽기 완료")
# 현재 연도 기준 최근 3년 설정 (2025년 기준)
current_year = 2025
start_year = current_year - 3
logging.info("분석할 기간: %d년부터 %d년까지", start_year, current_year)
# B열이 리뷰 날짜라고 가정
df['B'] = pd.to_datetime(df.iloc[:, 1], errors='coerce')
df = df.dropna(subset=['B'])
df['Year'] = df['B'].dt.year
df['Month'] = df['B'].dt.month
# 최근 3년 데이터 필터링
df_filtered = df[(df['Year'] > start_year) & (df['Year'] <= current_year)]
logging.info("최근 3년 데이터 필터링 완료: %d개의 데이터", len(df_filtered))
# 년월별 리뷰 건수 집계
df_filtered['Year-Month'] = df_filtered['B'].dt.strftime('%Y-%m')
review_counts = df_filtered.groupby('Year-Month').size().reset_index(name='Review Count')
logging.info("월별 리뷰 건수 집계 완료")
# 새로운 시트에 저장
with pd.ExcelWriter(file_path, engine='openpyxl', mode='a') as writer:
review_counts.to_excel(writer, sheet_name='월별 리뷰건수', index=False, header=False, startrow=0, startcol=0)
logging.info("새로운 시트 '월별 리뷰건수'에 저장 완료")
return file_path
except Exception as e:
logging.error("분석 중 오류 발생: %s", e)
return None
# 그라디오 인터페이스 정의
def main():
with gr.Blocks() as demo:
gr.Markdown("# 리뷰 분석 스페이스")
with gr.Row():
file_input = gr.File(label="원본 엑셀 파일 업로드", file_types=[".xlsx"])
analyze_button = gr.Button("분석")
file_output = gr.File(label="분석된 엑셀 파일 다운로드", file_types=[".xlsx"], type="filepath")
analyze_button.click(fn=analyze_reviews, inputs=file_input, outputs=file_output)
demo.launch()
if __name__ == "__main__":
main()