Spaces:

ginipick
/

AI-BOOK

Running on CPU Upgrade

App Files Files Community

ginipick commited on May 19

Commit

88cc048

verified ·

1 Parent(s): 48f2d8b

Update app.py

Browse files

Files changed (1) hide show

app.py +203 -105

app.py CHANGED Viewed

@@ -49,7 +49,19 @@ ADMIN_PASSWORD = os.getenv("PASSWORD", "admin")  # 환경 변수에서 가져오
 # OpenAI API 키 설정
 OPENAI_API_KEY = os.getenv("LLM_API", "")
-openai_client = OpenAI(api_key=OPENAI_API_KEY)
 # 전역 캐시 객체
 pdf_cache: Dict[str, Dict[str, Any]] = {}
@@ -224,8 +236,16 @@ async def get_pdf_embedding(pdf_id: str) -> Dict[str, Any]:
         return {"error": str(e), "pdf_id": pdf_id}
 # PDF 내용 기반 질의응답
 async def query_pdf(pdf_id: str, query: str) -> Dict[str, Any]:
     try:
         # 임베딩 데이터 가져오기
         embedding_data = await get_pdf_embedding(pdf_id)
         if "error" in embedding_data:
@@ -234,7 +254,6 @@ async def query_pdf(pdf_id: str, query: str) -> Dict[str, Any]:
         # 청크 텍스트 모으기 (임시로 간단하게 전체 텍스트 사용)
         all_text = "\n\n".join([f"Page {chunk['page']}: {chunk['text']}" for chunk in embedding_data["chunks"]])
-        # OpenAI API 호출
         # 컨텍스트 크기를 고려하여 텍스트가 너무 길면 앞부분만 사용
         max_context_length = 60000  # 토큰 수가 아닌 문자 수 기준 (대략적인 제한)
         if len(all_text) > max_context_length:
@@ -249,37 +268,66 @@ async def query_pdf(pdf_id: str, query: str) -> Dict[str, Any]:
         # gpt-4.1-mini 모델 사용
         try:
-            response = openai_client.chat.completions.create(
-                model="gpt-4.1-mini",
-                messages=[
-                    {"role": "system", "content": system_prompt},
-                    {"role": "user", "content": f"다음 PDF 내용을 참고하여 질문에 답변해주세요.\n\nPDF 내용:\n{all_text}\n\n질문: {query}"}
-                ],
-                temperature=0.7,
-                max_tokens=2048
-            )
-            answer = response.choices[0].message.content
-            return {
-                "answer": answer,
-                "pdf_id": pdf_id,
-                "query": query
-            }
         except Exception as api_error:
-            logger.error(f"OpenAI API 호출 오류: {api_error}")
-            return {"error": f"AI 응답 생성 중 오류가 발생했습니다: {str(api_error)}"}
     except Exception as e:
         logger.error(f"질의응답 처리 오류: {e}")
         return {"error": str(e)}
 # PDF 요약 생성
 async def summarize_pdf(pdf_id: str) -> Dict[str, Any]:
     try:
         # 임베딩 데이터 가져오기
         embedding_data = await get_pdf_embedding(pdf_id)
         if "error" in embedding_data:
-            return {"error": embedding_data["error"]}
         # 청크 텍스트 모으기 (제한된 길이)
         all_text = "\n\n".join([f"Page {chunk['page']}: {chunk['text']}" for chunk in embedding_data["chunks"]])
@@ -291,29 +339,54 @@ async def summarize_pdf(pdf_id: str) -> Dict[str, Any]:
         # OpenAI API 호출
         try:
-            response = openai_client.chat.completions.create(
-                model="gpt-4.1-mini",
-                messages=[
-                    {"role": "system", "content": "다음 PDF 내용을 간결하게 요약해주세요. 핵심 주제와 주요 포인트를 포함한 요약을 500자 이내로 작성해주세요."},
-                    {"role": "user", "content": f"PDF 내용:\n{all_text}"}
-                ],
-                temperature=0.7,
-                max_tokens=1024
-            )
-            summary = response.choices[0].message.content
-            return {
-                "summary": summary,
-                "pdf_id": pdf_id
-            }
         except Exception as api_error:
-            logger.error(f"OpenAI API 호출 오류: {api_error}")
-            return {"error": f"AI 요약 생성 중 오류가 발생했습니다: {str(api_error)}"}
     except Exception as e:
         logger.error(f"PDF 요약 생성 오류: {e}")
-        return {"error": str(e)}
 # 최적화된 PDF 페이지 캐싱 함수
 async def cache_pdf(pdf_path: str):
     try:
@@ -2268,79 +2341,104 @@ HTML = """
     }
     // PDF 요약 로드 함수
-    async function loadPdfSummary() {
-      if (!currentPdfId || isAiProcessing || hasLoadedSummary) return;
-      try {
-        isAiProcessing = true;
-        const typingIndicator = addTypingIndicator();
-        // 서버에 요약 요청
-        const response = await fetch(`/api/ai/summarize-pdf/${currentPdfId}`);
-        const data = await response.json();
-        // 로딩 표시기 제거
-        typingIndicator.remove();
-        if (data.error) {
-          addChatMessage(`요약을 생성하는 중 오류가 발생했습니다: ${data.error}`);
-        } else {
-          // 환영 메시지와 요약 추가
-          addChatMessage(`안녕하세요! 이 PDF에 대해 어떤 것이든 질문해주세요. 제가 도와드리겠습니다.<br><br><strong>PDF 요약:</strong><br>${data.summary}`);
-          hasLoadedSummary = true;
-        }
-      } catch (error) {
-        console.error("PDF 요약 로드 오류:", error);
-        addChatMessage("PDF 요약을 로드하는 중 오류가 발생했습니다. 잠시 후 다시 시도해주세요.");
-      } finally {
-        isAiProcessing = false;
       }
     }
-    // 질문 제출 함수
-    async function submitQuestion(question) {
-      if (!currentPdfId || isAiProcessing || !question.trim()) return;
-      try {
-        isAiProcessing = true;
-        $id('aiChatSubmit').disabled = true;
-        // 사용자 메시지 추가
-        addChatMessage(question, true);
-        // 로딩 표시기 추가
-        const typingIndicator = addTypingIndicator();
-        // 서버에 질의 요청
-        const response = await fetch(`/api/ai/query-pdf/${currentPdfId}`, {
-          method: 'POST',
-          headers: {
-            'Content-Type': 'application/json'
-          },
-          body: JSON.stringify({ query: question })
-        });
-        const data = await response.json();
-        // 로딩 표시기 제거
-        typingIndicator.remove();
-        if (data.error) {
-          addChatMessage(`죄송합니다. 질문에 답변하는 중 오류가 발생했습니다: ${data.error}`);
-        } else {
-          // AI 응답 추가 (마크다운 처리 등 필요시 추가)
-          addChatMessage(data.answer);
-        }
-      } catch (error) {
-        console.error("질문 제출 오류:", error);
-        addChatMessage("죄송합니다. 서버와 통신 중 오류가 발생했습니다. 잠시 후 다시 시도해주세요.");
-      } finally {
-        isAiProcessing = false;
-        $id('aiChatSubmit').disabled = false;
-        $id('aiChatInput').value = '';
-        $id('aiChatInput').focus();
       }
     }
     // DOM이 로드되면 실행
     document.addEventListener('DOMContentLoaded', function() {

 # OpenAI API 키 설정
 OPENAI_API_KEY = os.getenv("LLM_API", "")
+# API 키가 없거나 비어있을 때 플래그 설정
+HAS_VALID_API_KEY = bool(OPENAI_API_KEY and OPENAI_API_KEY.strip())
+if HAS_VALID_API_KEY:
+    try:
+        openai_client = OpenAI(api_key=OPENAI_API_KEY, timeout=30.0)
+        logger.info("OpenAI 클라이언트 초기화 성공")
+    except Exception as e:
+        logger.error(f"OpenAI 클라이언트 초기화 실패: {e}")
+        HAS_VALID_API_KEY = False
+else:
+    logger.warning("유효한 OpenAI API 키가 없습니다. AI 기능이 제한됩니다.")
+    openai_client = None
 # 전역 캐시 객체
 pdf_cache: Dict[str, Dict[str, Any]] = {}
         return {"error": str(e), "pdf_id": pdf_id}
 # PDF 내용 기반 질의응답
+# PDF 내용 기반 질의응답 함수 개선
 async def query_pdf(pdf_id: str, query: str) -> Dict[str, Any]:
     try:
+        # API 키가 없거나 유효하지 않은 경우
+        if not HAS_VALID_API_KEY or not openai_client:
+            return {
+                "error": "OpenAI API 키가 설정되지 않았습니다.",
+                "answer": "죄송합니다. 현재 AI 기능이 비활성화되어 있어 질문에 답변할 수 없습니다. 시스템 관리자에게 문의하세요."
+            }
         # 임베딩 데이터 가져오기
         embedding_data = await get_pdf_embedding(pdf_id)
         if "error" in embedding_data:
         # 청크 텍스트 모으기 (임시로 간단하게 전체 텍스트 사용)
         all_text = "\n\n".join([f"Page {chunk['page']}: {chunk['text']}" for chunk in embedding_data["chunks"]])
         # 컨텍스트 크기를 고려하여 텍스트가 너무 길면 앞부분만 사용
         max_context_length = 60000  # 토큰 수가 아닌 문자 수 기준 (대략적인 제한)
         if len(all_text) > max_context_length:
         # gpt-4.1-mini 모델 사용
         try:
+            # 타임아웃 및 재시도 설정 개선
+            for attempt in range(3):  # 최대 3번 재시도
+                try:
+                    response = openai_client.chat.completions.create(
+                        model="gpt-4.1-mini",
+                        messages=[
+                            {"role": "system", "content": system_prompt},
+                            {"role": "user", "content": f"다음 PDF 내용을 참고하여 질문에 답변해주세요.\n\nPDF 내용:\n{all_text}\n\n질문: {query}"}
+                        ],
+                        temperature=0.7,
+                        max_tokens=2048,
+                        timeout=30.0  # 30초 타임아웃
+                    )
+                    answer = response.choices[0].message.content
+                    return {
+                        "answer": answer,
+                        "pdf_id": pdf_id,
+                        "query": query
+                    }
+                except Exception as api_error:
+                    logger.error(f"OpenAI API 호출 오류 (시도 {attempt+1}/3): {api_error}")
+                    if attempt == 2:  # 마지막 시도에서도 실패
+                        raise api_error
+                    await asyncio.sleep(1 * (attempt + 1))  # 재시도 간 지연 시간 증가
+            # 여기까지 도달하지 않아야 함
+            raise Exception("API 호출 재시도 모두 실패")
         except Exception as api_error:
+            logger.error(f"OpenAI API 호출 최종 오류: {api_error}")
+            # 오류 유형에 따른 더 명확한 메시지 제공
+            error_message = str(api_error)
+            if "Connection" in error_message:
+                return {"error": "OpenAI 서버와 연결할 수 없습니다. 인터넷 연결을 확인하세요."}
+            elif "Unauthorized" in error_message or "Authentication" in error_message:
+                return {"error": "API 키가 유효하지 않습니다."}
+            elif "Rate limit" in error_message:
+                return {"error": "API 호출 한도를 초과했습니다. 잠시 후 다시 시도하세요."}
+            else:
+                return {"error": f"AI 응답 생성 중 오류가 발생했습니다: {error_message}"}
     except Exception as e:
         logger.error(f"질의응답 처리 오류: {e}")
         return {"error": str(e)}
 # PDF 요약 생성
+# PDF 요약 생성 함수 개선
 async def summarize_pdf(pdf_id: str) -> Dict[str, Any]:
     try:
+        # API 키가 없거나 유효하지 않은 경우
+        if not HAS_VALID_API_KEY or not openai_client:
+            return {
+                "error": "OpenAI API 키가 설정되지 않았습니다. 'LLM_API' 환경 변수를 확인하세요.",
+                "summary": "API 키가 없어 요약을 생성할 수 없습니다. 시스템 관리자에게 문의하세요."
+            }
         # 임베딩 데이터 가져오기
         embedding_data = await get_pdf_embedding(pdf_id)
         if "error" in embedding_data:
+            return {"error": embedding_data["error"], "summary": "PDF에서 텍스트를 추출할 수 없습니다."}
         # 청크 텍스트 모으기 (제한된 길이)
         all_text = "\n\n".join([f"Page {chunk['page']}: {chunk['text']}" for chunk in embedding_data["chunks"]])
         # OpenAI API 호출
         try:
+            # 타임아웃 및 재시도 설정 개선
+            for attempt in range(3):  # 최대 3번 재시도
+                try:
+                    response = openai_client.chat.completions.create(
+                        model="gpt-4.1-mini",
+                        messages=[
+                            {"role": "system", "content": "다음 PDF 내용을 간결하게 요약해주세요. 핵심 주제와 주요 포인트를 포함한 요약을 500자 이내로 작성해주세요."},
+                            {"role": "user", "content": f"PDF 내용:\n{all_text}"}
+                        ],
+                        temperature=0.7,
+                        max_tokens=1024,
+                        timeout=30.0  # 30초 타임아웃
+                    )
+                    summary = response.choices[0].message.content
+                    return {
+                        "summary": summary,
+                        "pdf_id": pdf_id
+                    }
+                except Exception as api_error:
+                    logger.error(f"OpenAI API 호출 오류 (시도 {attempt+1}/3): {api_error}")
+                    if attempt == 2:  # 마지막 시도에서도 실패
+                        raise api_error
+                    await asyncio.sleep(1 * (attempt + 1))  # 재시도 간 지연 시간 증가
+            # 여기까지 도달하지 않아야 함
+            raise Exception("API 호출 재시도 모두 실패")
         except Exception as api_error:
+            logger.error(f"OpenAI API 호출 최종 오류: {api_error}")
+            # 오류 유형에 따른 더 명확한 메시지 제공
+            error_message = str(api_error)
+            if "Connection" in error_message:
+                return {"error": "OpenAI 서버와 연결할 수 없습니다. 인터넷 연결을 확인하세요.", "pdf_id": pdf_id}
+            elif "Unauthorized" in error_message or "Authentication" in error_message:
+                return {"error": "API 키가 유효하지 않습니다.", "pdf_id": pdf_id}
+            elif "Rate limit" in error_message:
+                return {"error": "API 호출 한도를 초과했습니다. 잠시 후 다시 시도하세요.", "pdf_id": pdf_id}
+            else:
+                return {"error": f"AI 요약 생성 중 오류가 발생했습니다: {error_message}", "pdf_id": pdf_id}
     except Exception as e:
         logger.error(f"PDF 요약 생성 오류: {e}")
+        return {
+            "error": str(e),
+            "summary": "PDF 요약 중 오류가 발생했습니다. PDF 페이지 수가 너무 많거나 형식이 지원되지 않을 수 있습니다."
+        }
 # 최적화된 PDF 페이지 캐싱 함수
 async def cache_pdf(pdf_path: str):
     try:
     }
     // PDF 요약 로드 함수
+// PDF 요약 로드 함수
+async function loadPdfSummary() {
+  if (!currentPdfId || isAiProcessing || hasLoadedSummary) return;
+  try {
+    isAiProcessing = true;
+    const typingIndicator = addTypingIndicator();
+    // 서버에 요약 요청
+    const response = await fetch(`/api/ai/summarize-pdf/${currentPdfId}`);
+    const data = await response.json();
+    // 로딩 표시기 제거
+    typingIndicator.remove();
+    if (data.error) {
+      // 오류 메시지 표시
+      addChatMessage(`PDF 요약을 생성하는 중 문제가 발생했습니다: ${data.error}<br><br>계속 질문을 입력하시면 PDF 내용을 기반으로 답변을 시도하겠습니다.`);
+      // 요약이 실패해도 특정 경우에는 사용자에게 알리고 계속 사용 가능하도록 설정
+      if (data.summary) {
+        addChatMessage(`<strong>PDF에서 추출한 정보:</strong><br>${data.summary}`);
+        hasLoadedSummary = true;
       }
+    } else {
+      // 환영 메시지와 요약 추가
+      addChatMessage(`안녕하세요! 이 PDF에 대해 어떤 것이든 질문해주세요. 제가 도와드리겠습니다.<br><br><strong>PDF 요약:</strong><br>${data.summary}`);
+      hasLoadedSummary = true;
     }
+  } catch (error) {
+    console.error("PDF 요약 로드 오류:", error);
+    addChatMessage(`PDF 요약을 로드하는 중 오류가 발생했습니다. 서버 연결을 확인해주세요.<br><br>어떤 질문이든 입력하시면 최선을 다해 답변하겠습니다.`);
+  } finally {
+    isAiProcessing = false;
+  }
+}
+// 질문 제출 함수
+async function submitQuestion(question) {
+  if (!currentPdfId || isAiProcessing || !question.trim()) return;
+  try {
+    isAiProcessing = true;
+    $id('aiChatSubmit').disabled = true;
+    // 사용자 메시지 추가
+    addChatMessage(question, true);
+    // 로딩 표시기 추가
+    const typingIndicator = addTypingIndicator();
+    // 서버에 질의 요청
+    const response = await fetch(`/api/ai/query-pdf/${currentPdfId}`, {
+      method: 'POST',
+      headers: {
+        'Content-Type': 'application/json'
+      },
+      body: JSON.stringify({ query: question }),
+      // 타임아웃 설정 추가
+      signal: AbortSignal.timeout(60000) // 60초 타임아웃
+    });
+    const data = await response.json();
+    // 로딩 표시기 제거
+    typingIndicator.remove();
+    if (data.error) {
+      // 오류 메시지에 따라 다른 친절한 안내 제공
+      if (data.error.includes("API 키")) {
+        addChatMessage("죄송합니다. 현재 AI 서비스에 연결할 수 없습니다. 시스템 관리자에게 API 키 설정을 확인해달라고 요청해주세요.");
+      } else if (data.error.includes("연결")) {
+        addChatMessage("죄송합니다. AI 서비스에 연결할 수 없습니다. 인터넷 연결을 확인하거나 잠시 후 다시 시도해주세요.");
+      } else {
+        addChatMessage(`죄송합니다. 질문에 답변하는 중 문제가 발생했습니다: ${data.error}`);
       }
+    } else {
+      // AI 응답 추가
+      addChatMessage(data.answer);
+    }
+  } catch (error) {
+    console.error("질문 제출 오류:", error);
+    if (error.name === 'AbortError') {
+      addChatMessage("죄송합니다. 응답 시간이 너무 오래 걸려 요청이 취소되었습니다. 인터넷 연결을 확인하거나 더 짧은 질문으로 다시 시도해보세요.");
+    } else {
+      addChatMessage("죄송합니다. 서버와 통신 중 오류가 발생했습니다. 잠시 후 다시 시도해주세요.");
     }
+  } finally {
+    isAiProcessing = false;
+    $id('aiChatSubmit').disabled = false;
+    $id('aiChatInput').value = '';
+    $id('aiChatInput').focus();
+  }
+}
     // DOM이 로드되면 실행
     document.addEventListener('DOMContentLoaded', function() {