kai-llm-insu

Sleeping

seawolf2357 commited on Jul 28, 2024

Commit

4531be2

verified ·

1 Parent(s): efb2b1d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -28,15 +28,27 @@ SPECIFIC_CHANNEL_ID = int(os.getenv("DISCORD_CHANNEL_ID"))
 conversation_history = []
 # JSON 데이터셋 로드
-with open("jangtest.json", "r", encoding="utf-8") as f:
-    dataset = json.load(f)
 # 문장 임베딩 모델 로드
 model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')
 # 데이터셋의 임베딩을 미리 계산
-dataset_texts = [json.dumps(item, ensure_ascii=False) for item in dataset]
-dataset_embeddings = model.encode(dataset_texts, convert_to_tensor=True)
 class MyClient(discord.Client):
     def __init__(self, *args, **kwargs):
@@ -109,6 +121,9 @@ async def generate_response(message):
     return f"{user_mention}, {full_response_text}"
 def find_most_similar_data(query):
     query_embedding = model.encode(query, convert_to_tensor=True)
     # 코사인 유사도 계산

 conversation_history = []
 # JSON 데이터셋 로드
+try:
+    with open("jangtest.json", "r", encoding="utf-8") as f:
+        dataset = json.load(f)
+    logging.info(f"Successfully loaded dataset with {len(dataset)} items.")
+except json.JSONDecodeError as e:
+    logging.error(f"Error decoding JSON: {e}")
+    logging.error("Please check the 'jangtest.json' file for any formatting errors.")
+    dataset = []
+except FileNotFoundError:
+    logging.error("The 'jangtest.json' file was not found.")
+    dataset = []
 # 문장 임베딩 모델 로드
 model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')
 # 데이터셋의 임베딩을 미리 계산
+if dataset:
+    dataset_texts = [json.dumps(item, ensure_ascii=False) for item in dataset]
+    dataset_embeddings = model.encode(dataset_texts, convert_to_tensor=True)
+else:
+    dataset_embeddings = torch.tensor([])
 class MyClient(discord.Client):
     def __init__(self, *args, **kwargs):
     return f"{user_mention}, {full_response_text}"
 def find_most_similar_data(query):
+    if not dataset_embeddings.numel():
+        return None
     query_embedding = model.encode(query, convert_to_tensor=True)
     # 코사인 유사도 계산