N_B_analysis-5

Sleeping

App Files Files Community

Kims12 commited on Feb 11

Commit

c242fd9

verified ·

1 Parent(s): 110447f

Update app.py

Browse files

Files changed (1) hide show

app.py +75 -30

app.py CHANGED Viewed

@@ -143,6 +143,7 @@ def get_header(method, uri, api_key, secret_key, customer_id):
         "X-Signature": signature
     }
 def fetch_related_keywords(keyword):
     debug_log(f"fetch_related_keywords 호출, 키워드: {keyword}")
     API_KEY = os.environ["NAVER_API_KEY"]
@@ -179,6 +180,80 @@ def fetch_related_keywords(keyword):
     debug_log("fetch_related_keywords 완료")
     return result_df
 def fetch_blog_count(keyword):
     debug_log(f"fetch_blog_count 호출, 키워드: {keyword}")
     client_id = os.environ["NAVER_SEARCH_CLIENT_ID"]
@@ -205,36 +280,6 @@ def create_excel_file(df):
     debug_log(f"Excel 파일 생성됨: {excel_path}")
     return excel_path
-def process_keyword(keywords: str, include_related: bool):
-    debug_log(f"process_keyword 호출, 키워드들: {keywords}, 연관검색어 포함: {include_related}")
-    input_keywords = [k.strip() for k in keywords.splitlines() if k.strip()]
-    result_dfs = []
-    for idx, kw in enumerate(input_keywords):
-        df_kw = fetch_related_keywords(kw)
-        if df_kw.empty:
-            continue
-        row_kw = df_kw[df_kw["정보키워드"] == kw]
-        if not row_kw.empty:
-            result_dfs.append(row_kw)
-        else:
-            result_dfs.append(df_kw.head(1))
-        if include_related and idx == 0:
-            df_related = df_kw[df_kw["정보키워드"] != kw]
-            if not df_related.empty:
-                result_dfs.append(df_related)
-    if result_dfs:
-        result_df = pd.concat(result_dfs, ignore_index=True)
-        result_df.drop_duplicates(subset=["정보키워드"], inplace=True)
-    else:
-        result_df = pd.DataFrame(columns=["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"])
-    result_df["블로그문서수"] = result_df["정보키워드"].apply(fetch_blog_count)
-    result_df.sort_values(by="토탈월검색량", ascending=False, inplace=True)
-    debug_log("process_keyword 완료")
-    return result_df, create_excel_file(result_df)
 # [참조코드-1] 및 [참조코드-2]를 활용한 형태소 분석 및 검색량, 블로그문서수 추가 (빈도수1 제거 옵션 포함)
 def morphological_analysis_and_enrich(text: str, remove_freq1: bool):
     debug_log("morphological_analysis_and_enrich 함수 시작")

         "X-Signature": signature
     }
+# 기존의 단일 키워드용 함수 (참고용)
 def fetch_related_keywords(keyword):
     debug_log(f"fetch_related_keywords 호출, 키워드: {keyword}")
     API_KEY = os.environ["NAVER_API_KEY"]
     debug_log("fetch_related_keywords 완료")
     return result_df
+# 신규 추가: 키워드 10개씩 그룹으로 묶어 한 번에 검색량을 조회하는 함수
+def fetch_related_keywords_batch(keywords: list):
+    debug_log(f"fetch_related_keywords_batch 호출, 키워드 그룹: {keywords}")
+    API_KEY = os.environ["NAVER_API_KEY"]
+    SECRET_KEY = os.environ["NAVER_SECRET_KEY"]
+    CUSTOMER_ID = os.environ["NAVER_CUSTOMER_ID"]
+    BASE_URL = "https://api.naver.com"
+    uri = "/keywordstool"
+    method = "GET"
+    headers = get_header(method, uri, API_KEY, SECRET_KEY, CUSTOMER_ID)
+    params = {
+        "hintKeywords": keywords,  # 그룹으로 전달 (최대 10개)
+        "showDetail": "1"
+    }
+    response = requests.get(BASE_URL + uri, params=params, headers=headers)
+    data = response.json()
+    if "keywordList" not in data:
+        return pd.DataFrame()
+    df = pd.DataFrame(data["keywordList"])
+    if len(df) > 100:
+        df = df.head(100)
+    def parse_count(x):
+        try:
+            return int(str(x).replace(",", ""))
+        except:
+            return 0
+    df["PC월검색량"] = df["monthlyPcQcCnt"].apply(parse_count)
+    df["모바일월검색량"] = df["monthlyMobileQcCnt"].apply(parse_count)
+    df["토탈월검색량"] = df["PC월검색량"] + df["모바일월검색량"]
+    df.rename(columns={"relKeyword": "정보키워드"}, inplace=True)
+    result_df = df[["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"]]
+    debug_log("fetch_related_keywords_batch 완료")
+    return result_df
+# 기존 process_keyword 함수를 그룹별로 10개씩 묶어 처리하도록 수정
+def process_keyword(keywords: str, include_related: bool):
+    debug_log(f"process_keyword 호출, 키워드들: {keywords}, 연관검색어 포함: {include_related}")
+    input_keywords = [k.strip() for k in keywords.splitlines() if k.strip()]
+    result_dfs = []
+    # 입력된 키워드를 10개씩 그룹으로 묶기
+    for i in range(0, len(input_keywords), 10):
+        batch = input_keywords[i:i+10]
+        df_batch = fetch_related_keywords_batch(batch)
+        if df_batch.empty:
+            continue
+        # 각 그룹 내에서 입력 키워드와 일치하는 행 추출
+        for kw in batch:
+            row_kw = df_batch[df_batch["정보키워드"] == kw]
+            if not row_kw.empty:
+                result_dfs.append(row_kw)
+            else:
+                result_dfs.append(df_batch.head(1))
+        # 첫 그룹의 경우 연관검색어 옵션 적용 (첫 키워드 제외)
+        if include_related and i == 0:
+            first_keyword = batch[0]
+            df_related = df_batch[df_batch["정보키워드"] != first_keyword]
+            if not df_related.empty:
+                result_dfs.append(df_related)
+    if result_dfs:
+        result_df = pd.concat(result_dfs, ignore_index=True)
+        result_df.drop_duplicates(subset=["정보키워드"], inplace=True)
+    else:
+        result_df = pd.DataFrame(columns=["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"])
+    result_df["블로그문서수"] = result_df["정보키워드"].apply(fetch_blog_count)
+    result_df.sort_values(by="토탈월검색량", ascending=False, inplace=True)
+    debug_log("process_keyword 완료")
+    return result_df, create_excel_file(result_df)
 def fetch_blog_count(keyword):
     debug_log(f"fetch_blog_count 호출, 키워드: {keyword}")
     client_id = os.environ["NAVER_SEARCH_CLIENT_ID"]
     debug_log(f"Excel 파일 생성됨: {excel_path}")
     return excel_path
 # [참조코드-1] 및 [참조코드-2]를 활용한 형태소 분석 및 검색량, 블로그문서수 추가 (빈도수1 제거 옵션 포함)
 def morphological_analysis_and_enrich(text: str, remove_freq1: bool):
     debug_log("morphological_analysis_and_enrich 함수 시작")