Spaces:

jeongsoo
/

RAG6_AgenticAI

No application file

File size: 38,386 Bytes

d93e680
542d44b
d93e680
 
 
 
 
 
 
542d44b
 
d93e680
 
 
 
5c6a38b
 
d93e680
61e46cb
 
 
542d44b
 
5c6a38b
61e46cb
 
d93e680
5c6a38b
d93e680
 
 
 
5c6a38b
d93e680
 
 
542d44b
d93e680
 
 
 
5c6a38b
d93e680
 
 
5c6a38b
d93e680
 
5c6a38b
d93e680
 
 
5c6a38b
d93e680
 
5c6a38b
 
d93e680
 
61e46cb
d93e680
5c6a38b
d93e680
61e46cb
d93e680
 
5c6a38b
 
542d44b
5c6a38b
53a0ebf
5c6a38b
d93e680
 
5c6a38b
d93e680
 
542d44b
d93e680
 
5c6a38b
53a0ebf
 
542d44b
 
d93e680
542d44b
d93e680
5c6a38b
d93e680
61e46cb
d93e680
 
542d44b
d93e680
 
 
5c6a38b
542d44b
 
61e46cb
 
 
 
 
542d44b
 
61e46cb
5c6a38b
542d44b
d93e680
 
542d44b
d93e680
 
 
5c6a38b
542d44b
61e46cb
 
d93e680
542d44b
d93e680
 
 
5c6a38b
542d44b
 
d93e680
 
5c6a38b
d93e680
542d44b
61e46cb
542d44b
 
61e46cb
 
 
d93e680
 
 
 
 
 
 
 
 
53a0ebf
5c6a38b
d93e680
 
542d44b
 
 
 
d93e680
 
5c6a38b
d93e680
 
5c6a38b
d93e680
 
542d44b
61e46cb
542d44b
 
d93e680
 
5c6a38b
d93e680
 
 
 
5c6a38b
d93e680
 
5c6a38b
d93e680
 
 
5c6a38b
 
d93e680
5c6a38b
 
d93e680
542d44b
74188c7
 
 
 
d93e680
b0188f6
 
 
 
 
 
 
 
 
 
d93e680
 
5c6a38b
d93e680
 
5c6a38b
b0188f6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d93e680
 
b0188f6
 
 
 
 
 
 
 
 
 
 
 
 
 
d93e680
b0188f6
 
 
 
 
 
d93e680
542d44b
d93e680
 
 
5c6a38b
d93e680
b0188f6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
61e46cb
b0188f6
 
 
 
 
d93e680
b0188f6
 
 
 
 
d93e680
542d44b
d93e680
 
 
5c6a38b
542d44b
 
 
 
 
61e46cb
 
 
d93e680
 
5c6a38b
d93e680
 
53a0ebf
5c6a38b
d93e680
542d44b
 
d93e680
61e46cb
5c6a38b
d93e680
 
 
542d44b
 
 
 
 
53a0ebf
61e46cb
 
d93e680
5c6a38b
d93e680
542d44b
61e46cb
542d44b
 
 
 
61e46cb
 
 
 
d93e680
 
542d44b
61e46cb
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
542d44b
 
 
61e46cb
542d44b
 
 
61e46cb
542d44b
 
61e46cb
 
 
542d44b
 
 
d93e680
 
542d44b
d93e680
 
542d44b
5c6a38b
 
d93e680
 
5c6a38b
542d44b
 
 
 
 
 
 
53a0ebf
d93e680
 
5c6a38b
542d44b
 
d93e680
 
5c6a38b
d93e680
 
61e46cb
542d44b
5c6a38b
d93e680
5c6a38b
542d44b
d93e680
542d44b
61e46cb
d93e680
 
 
5c6a38b
542d44b
61e46cb
542d44b
 
5c6a38b
d93e680
542d44b
d93e680
 
 
5c6a38b
53a0ebf
61e46cb
542d44b
bc73d45
61e46cb
bc73d45
61e46cb
542d44b
 
61e46cb
542d44b
61e46cb
 
542d44b
 
 
61e46cb
d93e680
 
 
542d44b
61e46cb
542d44b
61e46cb
542d44b
 
61e46cb
 
 
542d44b
 
 
 
61e46cb
542d44b
61e46cb
53a0ebf
61e46cb
 
542d44b
53a0ebf
61e46cb
 
 
 
 
 
542d44b
61e46cb
 
542d44b
 
 
61e46cb
 
 
 
 
 
d93e680
61e46cb
542d44b
 
61e46cb
542d44b
d93e680
542d44b
d93e680
5c6a38b
d93e680
 
 
 
 
 
 
61e46cb
542d44b
61e46cb

"""
RAG 검색 챗봇 웹 애플리케이션 - API 라우트 정의 (TypeError 재수정)
"""

import os
import json
import logging
import tempfile
import requests
import time # 앱 시작 시간 기록 위해 추가
import threading # threading.Event 사용 위해 추가
from flask import request, jsonify, render_template, send_from_directory, session, redirect, url_for
from datetime import datetime
from werkzeug.utils import secure_filename

# 로거 가져오기
logger = logging.getLogger(__name__)

# 앱 시작 시간 기록 (모듈 로드 시점)
APP_START_TIME = time.time()

# !! 중요: 함수 정의에서 app_ready_flag 대신 app_ready_event를 받도록 수정 !!
def register_routes(app, login_required, llm_interface, retriever, stt_client, DocumentProcessor, base_retriever, app_ready_event, ADMIN_USERNAME, ADMIN_PASSWORD, DEVICE_SERVER_URL):
    """Flask 애플리케이션에 기본 라우트 등록"""

    # 헬퍼 함수 (변경 없음)
    def allowed_audio_file(filename):
        """파일이 허용된 오디오 확장자를 가지는지 확인"""
        ALLOWED_AUDIO_EXTENSIONS = {'mp3', 'wav', 'ogg', 'm4a'}
        return '.' in filename and filename.rsplit('.', 1)[1].lower() in ALLOWED_AUDIO_EXTENSIONS

    def allowed_doc_file(filename):
        """파일이 허용된 문서 확장자를 가지는지 확인"""
        ALLOWED_DOC_EXTENSIONS = {'txt', 'md', 'pdf', 'docx', 'csv'}
        return '.' in filename and filename.rsplit('.', 1)[1].lower() in ALLOWED_DOC_EXTENSIONS

    # --- 로그인/로그아웃 라우트 ---
    @app.route('/login', methods=['GET', 'POST'])
    def login():
        error = None
        next_url = request.args.get('next')
        logger.info(f"-------------- 로그인 페이지 접속 (Next: {next_url}) --------------")
        logger.info(f"Method: {request.method}")

        if request.method == 'POST':
            logger.info("로그인 시도 받음")
            username = request.form.get('username', '')
            password = request.form.get('password', '')
            logger.info(f"입력된 사용자명: {username}")

            valid_username = ADMIN_USERNAME
            valid_password = ADMIN_PASSWORD
            logger.info(f"검증용 사용자명: {valid_username}")

            if username == valid_username and password == valid_password:
                logger.info(f"로그인 성공: {username}")
                session.permanent = True
                session['logged_in'] = True
                session['username'] = username
                logger.info(f"세션 설정 완료: {session}")
                redirect_to = next_url or url_for('index')
                logger.info(f"리디렉션 대상: {redirect_to}")
                response = redirect(redirect_to)
                logger.debug(f"로그인 응답 헤더 (Set-Cookie 확인): {response.headers.getlist('Set-Cookie')}")
                return response
            else:
                logger.warning("로그인 실패: 아이디 또는 비밀번호 불일치")
                error = '아이디 또는 비밀번호가 올바르지 않습니다.'
        else: # GET 요청
            logger.info("로그인 페이지 GET 요청")
            if session.get('logged_in'):
                logger.info("이미 로그인된 사용자, 메인 페이지로 리디렉션")
                return redirect(url_for('index'))

        logger.info("---------- 로그인 페이지 렌더링 ----------")
        return render_template('login.html', error=error, next=next_url)


    @app.route('/logout')
    def logout():
        """로그아웃 처리"""
        username = session.get('username', 'unknown')
        if session.pop('logged_in', None):
             session.pop('username', None)
             logger.info(f"사용자 {username} 로그아웃 처리 완료. 현재 세션: {session}")
        else:
             logger.warning("로그인되지 않은 상태에서 로그아웃 시도")

        logger.info("로그인 페이지로 리디렉션")
        response = redirect(url_for('login'))
        logger.debug(f"로그아웃 응답 헤더 (Set-Cookie 확인): {response.headers.getlist('Set-Cookie')}")
        return response

    # --- 메인 페이지 및 상태 확인 (app_ready_event 사용) ---
    @app.route('/')
    @login_required
    def index():
        """메인 페이지"""
        # app_ready_event가 Event 객체인지 확인하고 상태 가져오기
        is_ready = app_ready_event.is_set() if isinstance(app_ready_event, threading.Event) else False # 기본값 False

        time_elapsed = time.time() - APP_START_TIME

        if not is_ready:
            logger.info(f"앱이 아직 준비되지 않아 로딩 페이지 표시 (경과 시간: {time_elapsed:.1f}초)")
            # loading.html 템플릿이 있다고 가정
            return render_template('loading.html') # 200 OK와 로딩 페이지

        logger.info("메인 페이지 요청")
        # index.html 템플릿이 있다고 가정
        return render_template('index.html')


    @app.route('/api/status')
    @login_required
    def app_status():
        """앱 초기화 상태 확인 API"""
        is_ready = app_ready_event.is_set() if isinstance(app_ready_event, threading.Event) else False
        logger.info(f"앱 상태 확인 요청: {'Ready' if is_ready else 'Not Ready'}")
        return jsonify({"ready": is_ready})

    # --- LLM API ---
    @app.route('/api/llm', methods=['GET', 'POST'])
    @login_required
    def llm_api():
        """사용 가능한 LLM 목록 및 선택 API"""
        # is_ready = app_ready_event.is_set() if isinstance(app_ready_event, threading.Event) else False
        # LLM 목록 조회는 초기화 중에도 가능하도록 허용

        if request.method == 'GET':
            logger.info("LLM 목록 요청")
            try:
                # 객체 및 속성 확인 강화
                if llm_interface is None or not hasattr(llm_interface, 'get_current_llm_details') or not hasattr(llm_interface, 'SUPPORTED_LLMS'):
                     logger.error("LLM 인터페이스가 준비되지 않았거나 필요한 속성이 없습니다.")
                     return jsonify({"error": "LLM 인터페이스 오류"}), 500

                current_details = llm_interface.get_current_llm_details()
                supported_llms_dict = llm_interface.SUPPORTED_LLMS
                supported_list = [{
                    "name": name, "id": id, "current": id == current_details.get("id")
                } for name, id in supported_llms_dict.items()]

                return jsonify({
                    "supported_llms": supported_list,
                    "current_llm": current_details
                })
            except Exception as e:
                logger.error(f"LLM 정보 조회 오류: {e}", exc_info=True)
                return jsonify({"error": "LLM 정보 조회 중 오류 발생"}), 500

        elif request.method == 'POST':
            is_ready = app_ready_event.is_set() if isinstance(app_ready_event, threading.Event) else False
            if not is_ready: # LLM 변경은 앱 준비 완료 후 가능
                 return jsonify({"error": "앱이 아직 초기화 중입니다. 잠시 후 다시 시도해주세요."}), 503

            data = request.get_json()
            if not data or 'llm_id' not in data:
                return jsonify({"error": "LLM ID가 제공되지 않았습니다."}), 400

            llm_id = data['llm_id']
            logger.info(f"LLM 변경 요청: {llm_id}")

            try:
                # 객체 및 속성/메소드 확인 강화
                if llm_interface is None or not hasattr(llm_interface, 'set_llm') or not hasattr(llm_interface, 'llm_clients') or not hasattr(llm_interface, 'get_current_llm_details'):
                     logger.error("LLM 인터페이스가 준비되지 않았거나 필요한 속성/메소드가 없습니다.")
                     return jsonify({"error": "LLM 인터페이스 오류"}), 500

                if llm_id not in llm_interface.llm_clients:
                    return jsonify({"error": f"지원되지 않는 LLM ID: {llm_id}"}), 400

                success = llm_interface.set_llm(llm_id)
                if success:
                    new_details = llm_interface.get_current_llm_details()
                    logger.info(f"LLM이 '{new_details.get('name', llm_id)}'로 변경되었습니다.")
                    return jsonify({
                        "success": True,
                        "message": f"LLM이 '{new_details.get('name', llm_id)}'로 변경되었습니다.",
                        "current_llm": new_details
                    })
                else:
                    logger.error(f"LLM 변경 실패 (ID: {llm_id})")
                    return jsonify({"error": "LLM 변경 중 내부 오류 발생"}), 500
            except Exception as e:
                logger.error(f"LLM 변경 처리 중 오류: {e}", exc_info=True)
                return jsonify({"error": f"LLM 변경 중 오류 발생: {str(e)}"}), 500

    # --- Chat API ---
    @app.route('/api/chat', methods=['POST'])
    @login_required
    def chat():
        """텍스트 기반 채봇 API"""
        try:
            # 앱이 준비되었는지 확인
            is_ready = app_ready_event.is_set() if isinstance(app_ready_event, threading.Event) else False
            if not is_ready:
                logger.warning("앱이 아직 초기화 중입니다.")
                return jsonify({
                    "error": "앱 초기화 중...", 
                    "answer": "죄송합니다. 시스템이 아직 준비 중입니다.", 
                    "sources": []
                }), 503

            data = request.get_json()
            if not data or 'query' not in data:
                return jsonify({"error": "쿼리가 제공되지 않았습니다."}), 400

            query = data['query']
            logger.info(f"텍스트 쿼리 수신: {query[:100]}...")
            
            # 검색 엔진 처리 부분 수정
            search_results = []
            search_warning = None
            try:
                # retriever 상태 검증
                if retriever is None:
                    logger.warning("Retriever가 초기화되지 않았습니다.")
                    search_warning = "검색 기능이 아직 준비되지 않았습니다."
                elif hasattr(retriever, 'is_mock') and retriever.is_mock:
                    logger.info("Mock Retriever 사용 중 - 검색 결과 없음.")
                    search_warning = "검색 인덱스가 아직 구축 중입니다. 기본 응답만 제공됩니다."
                elif not hasattr(retriever, 'search'):
                    logger.warning("Retriever에 search 메소드가 없습니다.")
                    search_warning = "검색 기능이 현재 제한되어 있습니다."
                else:
                    logger.info(f"검색 수행: {query[:50]}...")
                    search_results = retriever.search(query, top_k=5, first_stage_k=6)
                    if not search_results:
                        logger.info("검색 결과가 없습니다.")
                    else:
                        logger.info(f"검색 결과: {len(search_results)}개 항목")
            except Exception as e:
                logger.error(f"검색 중 오류 발생: {str(e)}", exc_info=True)
                search_results = []
                search_warning = f"검색 중 오류 발생: {str(e)}"
            
            # LLM 응답 생성
            try:
                # DocumentProcessor 객체 및 메소드 확인
                context = ""
                if search_results:
                    if DocumentProcessor is None or not hasattr(DocumentProcessor, 'prepare_rag_context'):
                        logger.warning("DocumentProcessor가 준비되지 않았거나 prepare_rag_context 메소드가 없습니다.")
                    else:
                        context = DocumentProcessor.prepare_rag_context(search_results, field="text")
                        logger.info(f"컨텍스트 준비 완료 (길이: {len(context) if context else 0}자)")

                # LLM 인터페이스 객체 및 메소드 확인
                llm_id = data.get('llm_id', None)
                
                if not context:
                    if search_warning:
                        logger.info(f"컨텍스트 없음, 검색 경고: {search_warning}")
                        answer = f"죄송합니다. 질문에 대한 답변을 찾을 수 없습니다. ({search_warning})"
                    else:
                        logger.info("컨텍스트 없이 기본 응답 생성")
                        answer = "죄송합니다. 관련 정보를 찾을 수 없습니다."
                else:
                    if llm_interface is None or not hasattr(llm_interface, 'rag_generate'):
                        logger.error("LLM 인터페이스가 준비되지 않았거나 rag_generate 메소드가 없습니다.")
                        answer = "죄송합니다. 현재 LLM 서비스를 사용할 수 없습니다."
                    else:
                        # LLM 호출 전에 경고 메시지 추가
                        if search_warning:
                            modified_query = f"{query}\n\n참고: {search_warning}"
                            logger.info(f"경고 메시지와 함께 쿼리 생성: {modified_query[:100]}...")
                        else:
                            modified_query = query
                        
                        answer = llm_interface.rag_generate(modified_query, context, llm_id=llm_id)
                        logger.info(f"LLM 응답 생성 완료 (길이: {len(answer)})")

                # 소스 정보 추출
                sources = []
                if search_results:
                    for result in search_results:
                        if not isinstance(result, dict):
                            logger.warning(f"예상치 못한 검색 결과 형식: {type(result)}")
                            continue
                        source_info = {}
                        source_key = result.get("source")
                        if not source_key and "metadata" in result and isinstance(result["metadata"], dict):
                            source_key = result["metadata"].get("source")
                        
                        if source_key:
                            source_info["name"] = os.path.basename(source_key)
                            source_info["path"] = source_key
                        else:
                            source_info["name"] = "알 수 없는 소스"
                        
                        if "score" in result:
                            source_info["score"] = result["score"]
                        if "rerank_score" in result:
                            source_info["rerank_score"] = result["rerank_score"]
                            
                        sources.append(source_info)

                return jsonify({
                    "answer": answer,
                    "sources": sources,
                    "search_warning": search_warning
                })
                
            except Exception as e:
                logger.error(f"LLM 응답 생성 중 오류 발생: {str(e)}", exc_info=True)
                return jsonify({
                    "answer": f"죄송합니다. 응답 생성 중 오류가 발생했습니다: {str(e)}",
                    "sources": [],
                    "error": str(e)
                })
                
        except Exception as e:
            logger.error(f"채팅 API에서 예상치 못한 오류 발생: {str(e)}", exc_info=True)
            return jsonify({
                "error": f"예상치 못한 오류 발생: {str(e)}",
                "answer": "죄송합니다. 서버에서 오류가 발생했습니다.",
                "sources": []
            }), 500

    # --- Voice Chat API ---
    @app.route('/api/voice', methods=['POST'])
    @login_required
    def voice_chat():
        """음성 챗 API 엔드포인트"""
        try:
            # 앱이 준비되었는지 확인
            is_ready = app_ready_event.is_set() if isinstance(app_ready_event, threading.Event) else False
            if not is_ready:
                logger.warning("앱이 아직 초기화 중입니다.")
                return jsonify({"error": "앱 초기화 중...", "answer": "죄송합니다. 시스템이 아직 준비 중입니다."}), 503
            
            # STT 클라이언트 확인
            if stt_client is None or not hasattr(stt_client, 'transcribe_audio'):
                logger.error("음성 API 요청 시 STT 클라이언트가 준비되지 않음")
                return jsonify({"error": "음성 인식 서비스 준비 안됨"}), 503
            
            logger.info("음성 챗 요청 수신")
            
            if 'audio' not in request.files:
                logger.error("오디오 파일이 제공되지 않음")
                return jsonify({"error": "오디오 파일이 제공되지 않았습니다."}), 400
            
            audio_file = request.files['audio']
            logger.info(f"수신된 오디오 파일: {audio_file.filename} ({audio_file.content_type})")
            
            try:
                # 오디오 파일 임시 저장 및 처리
                with tempfile.NamedTemporaryFile(delete=True, suffix=os.path.splitext(audio_file.filename)[1]) as temp_audio:
                    audio_file.save(temp_audio.name)
                    logger.info(f"오디오 파일을 임시 저장: {temp_audio.name}")
                    # STT 수행 (바이트 전달 가정)
                    with open(temp_audio.name, 'rb') as f_bytes:
                        audio_bytes = f_bytes.read()
                    stt_result = stt_client.transcribe_audio(audio_bytes, language="ko")
                
                # STT 결과 처리
                if not isinstance(stt_result, dict) or not stt_result.get("success"):
                    error_msg = stt_result.get("error", "알 수 없는 STT 오류") if isinstance(stt_result, dict) else "STT 결과 형식 오류"
                    logger.error(f"음성인식 실패: {error_msg}")
                    return jsonify({"error": "음성인식 실패", "details": error_msg}), 500
                
                transcription = stt_result.get("text", "")
                if not transcription:
                    logger.warning("음성인식 결과가 비어있습니다.")
                    return jsonify({
                        "transcription": "",
                        "answer": "음성에서 텍스트를 인식하지 못했습니다.",
                        "sources": []
                    }), 200 # 200 OK와 메시지
                
                logger.info(f"음성인식 성공: {transcription[:50]}...")
                
                # --- RAG 및 LLM 호출 (Chat API와 동일 로직) ---
                # 검색 엔진 처리 부분
                search_results = []
                search_warning = None
                try:
                    # retriever 상태 검증
                    if retriever is None:
                        logger.warning("Retriever가 초기화되지 않았습니다.")
                        search_warning = "검색 기능이 아직 준비되지 않았습니다."
                    elif hasattr(retriever, 'is_mock') and retriever.is_mock:
                        logger.info("Mock Retriever 사용 중 - 검색 결과 없음.")
                        search_warning = "검색 인덱스가 아직 구축 중입니다. 기본 응답만 제공됩니다."
                    elif not hasattr(retriever, 'search'):
                        logger.warning("Retriever에 search 메소드가 없습니다.")
                        search_warning = "검색 기능이 현재 제한되어 있습니다."
                    else:
                        logger.info(f"검색 수행: {transcription[:50]}...")
                        search_results = retriever.search(transcription, top_k=5, first_stage_k=6)
                        if not search_results:
                            logger.info("검색 결과가 없습니다.")
                        else:
                            logger.info(f"검색 결과: {len(search_results)}개 항목")
                except Exception as e:
                    logger.error(f"검색 중 오류 발생: {str(e)}", exc_info=True)
                    search_results = []
                    search_warning = f"검색 중 오류 발생: {str(e)}"
                
                # LLM 응답 생성
                context = ""
                if search_results:
                    if DocumentProcessor is None or not hasattr(DocumentProcessor, 'prepare_rag_context'):
                        logger.warning("DocumentProcessor가 준비되지 않았거나 prepare_rag_context 메소드가 없습니다.")
                    else:
                        context = DocumentProcessor.prepare_rag_context(search_results, field="text")
                        logger.info(f"컨텍스트 준비 완료 (길이: {len(context) if context else 0}자)")
                
                # LLM 인터페이스 호출
                llm_id = request.form.get('llm_id', None) # form 데이터에서 llm_id 가져오기
                
                if not context:
                    if search_warning:
                        logger.info(f"컨텍스트 없음, 검색 경고: {search_warning}")
                        answer = f"죄송합니다. 질문에 대한 답변을 찾을 수 없습니다. ({search_warning})"
                    else:
                        logger.info("컨텍스트 없이 기본 응답 생성")
                        answer = "죄송합니다. 관련 정보를 찾을 수 없습니다."
                else:
                    if llm_interface is None or not hasattr(llm_interface, 'rag_generate'):
                        logger.error("LLM 인터페이스가 준비되지 않았거나 rag_generate 메소드가 없습니다.")
                        answer = "죄송합니다. 현재 LLM 서비스를 사용할 수 없습니다."
                    else:
                        # LLM 호출 전에 경고 메시지 추가
                        if search_warning:
                            modified_query = f"{transcription}\n\n참고: {search_warning}"
                            logger.info(f"경고 메시지와 함께 쿼리 생성: {modified_query[:100]}...")
                        else:
                            modified_query = transcription
                        
                        answer = llm_interface.rag_generate(modified_query, context, llm_id=llm_id)
                        logger.info(f"LLM 응답 생성 완료 (길이: {len(answer)})")
                
                # 소스 정보 추출
                sources = []
                if search_results:
                    for result in search_results:
                        if not isinstance(result, dict):
                            logger.warning(f"예상치 못한 검색 결과 형식: {type(result)}")
                            continue
                        source_info = {}
                        source_key = result.get("source")
                        if not source_key and "metadata" in result and isinstance(result["metadata"], dict):
                            source_key = result["metadata"].get("source")
                        
                        if source_key:
                            source_info["name"] = os.path.basename(source_key)
                            source_info["path"] = source_key
                        else:
                            source_info["name"] = "알 수 없는 소스"
                        
                        if "score" in result:
                            source_info["score"] = result["score"]
                        if "rerank_score" in result:
                            source_info["rerank_score"] = result["rerank_score"]
                        
                        sources.append(source_info)
                
                # 최종 응답
                response_data = {
                    "transcription": transcription,
                    "answer": answer,
                    "sources": sources,
                    "search_warning": search_warning
                }
                
                # LLM 정보 추가 (옵션)
                if hasattr(llm_interface, 'get_current_llm_details'):
                    response_data["llm"] = llm_interface.get_current_llm_details()
                
                return jsonify(response_data)
            
            except Exception as e:
                logger.error(f"음성 챗 처리 중 오류 발생: {e}", exc_info=True)
                return jsonify({
                    "error": "음성 처리 중 내부 오류 발생", 
                    "details": str(e),
                    "answer": "죄송합니다. 오디오 처리 중 오류가 발생했습니다."
                }), 500
                
        except Exception as e:
            logger.error(f"음성 API에서 예상치 못한 오류 발생: {str(e)}", exc_info=True)
            return jsonify({
                "error": f"예상치 못한 오류 발생: {str(e)}",
                "answer": "죄송합니다. 서버에서 오류가 발생했습니다."
            }), 500

    # --- Document Upload API ---
    @app.route('/api/upload', methods=['POST'])
    @login_required
    def upload_document():
        """지식베이스 문서 업로드 API"""
        is_ready = app_ready_event.is_set() if isinstance(app_ready_event, threading.Event) else False
        if not is_ready:
             return jsonify({"error": "앱 초기화 중..."}), 503

        # base_retriever 객체 및 필수 메소드 확인
        if base_retriever is None or not hasattr(base_retriever, 'add_documents') or not hasattr(base_retriever, 'save'):
            logger.error("문서 업로드 API 요청 시 base_retriever가 준비되지 않았거나 필수 메소드가 없습니다.")
            return jsonify({"error": "기본 검색기가 준비되지 않았습니다."}), 503

        if 'document' not in request.files:
            return jsonify({"error": "문서 파일이 제공되지 않았습니다."}), 400

        doc_file = request.files['document']
        if not doc_file or not doc_file.filename:
            return jsonify({"error": "선택된 파일이 없습니다."}), 400

        # ALLOWED_DOC_EXTENSIONS를 함수 내에서 다시 정의하거나 전역 상수로 사용
        ALLOWED_DOC_EXTENSIONS = {'txt', 'md', 'pdf', 'docx', 'csv'}
        if not allowed_doc_file(doc_file.filename):
            logger.warning(f"허용되지 않는 파일 형식: {doc_file.filename}")
            return jsonify({"error": f"허용되지 않는 파일 형식입니다. 허용: {', '.join(ALLOWED_DOC_EXTENSIONS)}"}), 400

        try:
            filename = secure_filename(doc_file.filename)
            # app.config 사용 확인
            if 'DATA_FOLDER' not in app.config:
                 logger.error("Flask app.config에 DATA_FOLDER가 설정되지 않았습니다.")
                 return jsonify({"error": "서버 설정 오류 (DATA_FOLDER)"}), 500
            data_folder = app.config['DATA_FOLDER']
            os.makedirs(data_folder, exist_ok=True)
            filepath = os.path.join(data_folder, filename)

            doc_file.save(filepath)
            logger.info(f"문서 저장 완료: {filepath}")

            # DocumentProcessor 객체 및 메소드 확인
            if DocumentProcessor is None or not hasattr(DocumentProcessor, 'csv_to_documents') or not hasattr(DocumentProcessor, 'text_to_documents'):
                 logger.error("DocumentProcessor가 준비되지 않았거나 필요한 메소드가 없습니다.")
                 try: os.remove(filepath) # 저장된 파일 삭제
                 except OSError: pass
                 return jsonify({"error": "문서 처리기 오류"}), 500

            content = None
            file_ext = filename.rsplit('.', 1)[1].lower()
            metadata = {"source": filename, "filename": filename, "filetype": file_ext, "filepath": filepath}
            docs = []

            # 파일 읽기 및 내용 추출
            if file_ext in ['txt', 'md', 'csv']:
                try:
                    with open(filepath, 'r', encoding='utf-8') as f:
                        content = f.read()
                except UnicodeDecodeError:
                    logger.info(f"UTF-8 디코딩 실패, CP949로 시도: {filename}")
                    try:
                        with open(filepath, 'r', encoding='cp949') as f:
                            content = f.read()
                    except Exception as e_cp949:
                        logger.error(f"CP949 디코딩 실패 ({filename}): {e_cp949}")
                        return jsonify({"error": "파일 인코딩을 읽을 수 없습니다 (UTF-8, CP949 시도 실패)."}), 400
                except Exception as e_read:
                    logger.error(f"파일 읽기 오류 ({filename}): {e_read}")
                    return jsonify({"error": f"파일 읽기 중 오류 발생: {str(e_read)}"}), 500
            elif file_ext == 'pdf':
                 logger.warning("PDF 처리는 구현되지 않았습니다.")
                 # 여기에 PDF 텍스트 추출 로직 추가 (예: PyPDF2 사용)
                 # content = extract_text_from_pdf(filepath)
            elif file_ext == 'docx':
                 logger.warning("DOCX 처리는 구현되지 않았습니다.")
                 # 여기에 DOCX 텍스트 추출 로직 추가 (예: python-docx 사용)
                 # content = extract_text_from_docx(filepath)

            # 문서 분할/처리
            if content is not None: # 내용이 성공적으로 읽혔거나 추출되었을 때만
                if file_ext == 'csv':
                    logger.info(f"CSV 파일 처리 시작: {filename}")
                    docs = DocumentProcessor.csv_to_documents(content, metadata)
                elif file_ext in ['txt', 'md'] or (file_ext in ['pdf', 'docx'] and content): # 텍스트 기반 또는 추출된 내용
                    logger.info(f"텍스트 기반 문서 처리 시작: {filename}")
                    # text_to_documents 함수가 청크 분할 등을 수행한다고 가정
                    docs = DocumentProcessor.text_to_documents(
                        content, metadata=metadata,
                        chunk_size=512, chunk_overlap=50 # 설정값 사용
                    )

            # 검색기에 추가 및 저장
            if docs:
                logger.info(f"{len(docs)}개 문서 청크를 검색기에 추가합니다...")
                base_retriever.add_documents(docs)

                logger.info(f"검색기 상태를 저장합니다...")
                # app.config 사용 확인
                if 'INDEX_PATH' not in app.config:
                     logger.error("Flask app.config에 INDEX_PATH가 설정되지 않았습니다.")
                     return jsonify({"error": "서버 설정 오류 (INDEX_PATH)"}), 500
                index_path = app.config['INDEX_PATH']
                # 인덱스 저장 경로가 폴더인지 파일인지 확인 필요 (VectorRetriever.save 구현에 따라 다름)
                # 여기서는 index_path가 디렉토리라고 가정하고 부모 디렉토리 생성
                os.makedirs(os.path.dirname(index_path), exist_ok=True)
                try:
                    base_retriever.save(index_path)
                    logger.info("인덱스 저장 완료")
                    # TODO: 재순위화 검색기(retriever) 업데이트 로직 필요 시 추가
                    # 예: if retriever and hasattr(retriever, 'update_base_retriever'): retriever.update_base_retriever(base_retriever)
                    return jsonify({
                        "success": True,
                        "message": f"파일 '{filename}' 업로드 및 처리 완료 ({len(docs)}개 청크 추가)."
                    })
                except Exception as e_save:
                    logger.error(f"인덱스 저장 중 오류 발생: {e_save}", exc_info=True)
                    # 저장 실패 시 추가된 문서 롤백 고려?
                    return jsonify({"error": f"인덱스 저장 중 오류: {str(e_save)}"}), 500
            else:
                logger.warning(f"파일 '{filename}'에서 처리할 내용이 없거나 지원되지 않는 형식입니다.")
                # 파일은 저장되었으므로 warning 반환
                return jsonify({
                    "warning": True, # 'success' 대신 'warning' 사용
                    "message": f"파일 '{filename}'이 저장되었지만 처리할 내용이 없거나 지원되지 않는 형식입니다."
                })

        except Exception as e:
            logger.error(f"파일 업로드 또는 처리 중 오류 발생: {e}", exc_info=True)
            # 오류 발생 시 저장된 파일 삭제
            if 'filepath' in locals() and os.path.exists(filepath):
                try: os.remove(filepath)
                except OSError as e_del: logger.error(f"업로드 실패 후 파일 삭제 오류: {e_del}")
            return jsonify({"error": f"파일 업로드 중 오류: {str(e)}"}), 500

    # --- Document List API ---
    @app.route('/api/documents', methods=['GET'])
    @login_required
    def list_documents():
        """지식베이스 문서 목록 API"""
        logger.info("문서 목록 API 요청 시작")

        # base_retriever 상태 확인
        if base_retriever is None:
            logger.warning("문서 API 요청 시 base_retriever가 None입니다.")
            return jsonify({"documents": [], "total_documents": 0, "total_chunks": 0})
        elif not hasattr(base_retriever, 'documents'):
             logger.warning("문서 API 요청 시 base_retriever에 'documents' 속성이 없습니다.")
             return jsonify({"documents": [], "total_documents": 0, "total_chunks": 0})

        # 로깅 추가
        logger.info(f"base_retriever 객체 타입: {type(base_retriever)}")
        logger.info(f"base_retriever.documents 존재 여부: {hasattr(base_retriever, 'documents')}")
        doc_list_attr = getattr(base_retriever, 'documents', None) # 안전하게 속성 가져오기
        logger.info(f"base_retriever.documents 타입: {type(doc_list_attr)}")
        logger.info(f"base_retriever.documents 길이: {len(doc_list_attr) if isinstance(doc_list_attr, list) else 'N/A'}")

        try:
            sources = {}
            total_chunks = 0
            doc_list = doc_list_attr # 위에서 가져온 속성 사용

            # doc_list가 리스트인지 확인
            if not isinstance(doc_list, list):
                 logger.error(f"base_retriever.documents가 리스트가 아님: {type(doc_list)}")
                 return jsonify({"error": "내부 데이터 구조 오류"}), 500

            logger.info(f"총 {len(doc_list)}개 문서 청크에서 소스 목록 생성 중...")
            for i, doc in enumerate(doc_list):
                # 각 청크가 딕셔너리 형태인지 확인 (Langchain Document 객체도 딕셔너리처럼 동작 가능)
                if not hasattr(doc, 'get'): # 딕셔너리 또는 유사 객체인지 확인
                     logger.warning(f"청크 {i}가 딕셔너리 타입이 아님: {type(doc)}")
                     continue

                # 소스 정보 추출 (metadata 우선)
                source = "unknown"
                metadata = doc.get("metadata")
                if isinstance(metadata, dict):
                    source = metadata.get("source", "unknown")
                # metadata에 없으면 doc 자체에서 찾기 (하위 호환성)
                if source == "unknown":
                    source = doc.get("source", "unknown")

                if source != "unknown":
                    if source in sources:
                        sources[source]["chunks"] += 1
                    else:
                        # filename, filetype 추출 (metadata 우선)
                        filename = metadata.get("filename", source) if isinstance(metadata, dict) else source
                        filetype = metadata.get("filetype", "unknown") if isinstance(metadata, dict) else "unknown"
                        # metadata에 없으면 doc 자체에서 찾기
                        if filename == source and doc.get("filename"): filename = doc["filename"]
                        if filetype == "unknown" and doc.get("filetype"): filetype = doc["filetype"]

                        sources[source] = {
                            "filename": filename,
                            "chunks": 1,
                            "filetype": filetype
                        }
                    total_chunks += 1
                else:
                     # 소스 정보가 없는 청크 로깅 (너무 많으면 주석 처리)
                     logger.warning(f"청크 {i}에서 소스 정보를 찾을 수 없음: {str(doc)[:200]}...") # 내용 일부 로깅

            # 최종 목록 생성 및 정렬
            documents = [{"source": src, **info} for src, info in sources.items()]
            documents.sort(key=lambda x: x.get("filename", ""), reverse=False) # 파일명 기준 오름차순 정렬

            logger.info(f"문서 목록 조회 완료: {len(documents)}개 소스 파일, {total_chunks}개 청크")
            return jsonify({
                "documents": documents,
                "total_documents": len(documents),
                "total_chunks": total_chunks
            })

        except Exception as e:
            logger.error(f"문서 목록 조회 중 심각한 오류 발생: {e}", exc_info=True)
            # 503 대신 500 반환
            return jsonify({"error": f"문서 목록 조회 중 오류: {str(e)}"}), 500