na_ver-1

Sleeping

App Files Files Community

Kims12 commited on Feb 13

Commit

68610a8

verified ·

1 Parent(s): c9c3967

Update app.py

Browse files

Files changed (1) hide show

app.py +40 -26

app.py CHANGED Viewed

@@ -8,13 +8,13 @@ import pandas as pd
 import tempfile
 import gradio as gr
-# 인증 서명을 생성하는 함수
 def generate_signature(timestamp, method, uri, secret_key):
     message = f"{timestamp}.{method}.{uri}"
     digest = hmac.new(secret_key.encode("utf-8"), message.encode("utf-8"), hashlib.sha256).digest()
     return base64.b64encode(digest).decode()
-# API 호출 헤더를 생성하는 함수
 def get_header(method, uri, api_key, secret_key, customer_id):
     timestamp = str(round(time.time() * 1000))
     signature = generate_signature(timestamp, method, uri, secret_key)
@@ -26,13 +26,9 @@ def get_header(method, uri, api_key, secret_key, customer_id):
         "X-Signature": signature
     }
-# 네이버 연관검색어 및 검색량 데이터를 가져오는 함수
 def fetch_related_keywords(keyword):
-    """
-    단일 키워드에 대해 네이버 검색광고 API를 호출하여 연관검색어 및 검색량 데이터를 DataFrame으로 반환합니다.
-    반환 컬럼: "정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"
-    """
-    # 환경변수에서 API 키 등을 읽어옵니다 (기본값 없이 사용)
     API_KEY = os.environ["NAVER_API_KEY"]
     SECRET_KEY = os.environ["NAVER_SECRET_KEY"]
     CUSTOMER_ID = os.environ["NAVER_CUSTOMER_ID"]
@@ -41,7 +37,6 @@ def fetch_related_keywords(keyword):
     uri = "/keywordstool"
     method = "GET"
     headers = get_header(method, uri, API_KEY, SECRET_KEY, CUSTOMER_ID)
-    # API 파라미터: hintKeywords는 리스트로 전달
     params = {
         "hintKeywords": [keyword],
         "showDetail": "1"
@@ -51,11 +46,9 @@ def fetch_related_keywords(keyword):
     if "keywordList" not in data:
         return pd.DataFrame()
     df = pd.DataFrame(data["keywordList"])
-    # 최대 100개까지 결과 사용
     if len(df) > 100:
         df = df.head(100)
-    # 문자열 형태의 검색량을 정수로 변환하는 함수
     def parse_count(x):
         try:
             x_str = str(x).replace(",", "")
@@ -63,16 +56,31 @@ def fetch_related_keywords(keyword):
         except:
             return 0
-    # 각 검색량 필드를 정수형으로 변환 후 토탈 검색량 계산
     df["PC월검색량"] = df["monthlyPcQcCnt"].apply(parse_count)
     df["모바일월검색량"] = df["monthlyMobileQcCnt"].apply(parse_count)
     df["토탈월검색량"] = df["PC월검색량"] + df["모바일월검색량"]
-    # 'relKeyword' 컬럼명을 "정보키워드"로 변경
     df.rename(columns={"relKeyword": "정보키워드"}, inplace=True)
-    # 필요한 컬럼만 선택
     result_df = df[["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"]]
     return result_df
 # 임시 엑셀 파일 생성 함수
 def create_excel_file(df):
     with tempfile.NamedTemporaryFile(suffix=".xlsx", delete=False) as tmp:
@@ -83,10 +91,10 @@ def create_excel_file(df):
 # 입력된 여러 키워드를 처리하는 함수
 def process_keyword(keywords: str, include_related: bool):
     """
-    - 텍스트박스에 엔터로 구분된 여러 키워드를 받아 각 키워드의 검색량 정보를 조회합니다.
-    - 각 키워드에 대해 입력한 키워드 자체의 결과(검색량)를 추가합니다.
-    - 체크박스가 선택된 경우, 첫 번째 키워드에 대해서만 연관검색어(입력 키워드를 제외한 나머지 결과)를 추가합니다.
-    - 결과 DataFrame과 엑셀 파일 경로를 튜플로 반환합니다.
     """
     # 줄바꿈으로 분리하여 입력 키워드 리스트 생성 (빈 줄 제외)
     input_keywords = [k.strip() for k in keywords.splitlines() if k.strip() != ""]
@@ -96,15 +104,15 @@ def process_keyword(keywords: str, include_related: bool):
         df_kw = fetch_related_keywords(kw)
         if df_kw.empty:
             continue
-        # 입력 키워드에 해당하는 행을 찾습니다.
         row_kw = df_kw[df_kw["정보키워드"] == kw]
         if not row_kw.empty:
             result_dfs.append(row_kw)
         else:
-            # 만약 입력 키워드 행이 없다면 첫번째 행을 추가 (대체)
             result_dfs.append(df_kw.head(1))
-        # 체크박스가 True이고, 첫 번째 키워드인 경우에만 연관검색어 추가 (입력 키워드 제외)
         if include_related and idx == 0:
             df_related = df_kw[df_kw["정보키워드"] != kw]
             if not df_related.empty:
@@ -112,18 +120,24 @@ def process_keyword(keywords: str, include_related: bool):
     if result_dfs:
         result_df = pd.concat(result_dfs, ignore_index=True)
-        # 중복 행 제거 (만약 입력 키워드가 연관검색어 결과에 포함된 경우)
         result_df.drop_duplicates(subset=["정보키워드"], inplace=True)
     else:
         result_df = pd.DataFrame(columns=["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"])
-    # 토탈월검색량 내림차순 정렬 (선택사항)
     result_df.sort_values(by="토탈월검색량", ascending=False, inplace=True)
     return result_df, create_excel_file(result_df)
 # Gradio UI 구성
 with gr.Blocks() as demo:
-    gr.Markdown("### 네이버 연관검색어 및 검색량 조회 앱")
-    gr.Markdown("여러 키워드를 엔터로 구분하여 입력하면 각 키워드의 검색량 정보를 조회합니다. (첫 번째 키워드의 경우, '연관검색어 포함' 체크 시 연관검색어도 함께 조회됩니다.)")
     with gr.Row():
         keyword_input = gr.Textbox(label="키워드 입력 (여러 개일 경우 엔터로 구분)", lines=5, placeholder="예:\n강원도풀빌라\n자바스크립트")
@@ -134,7 +148,7 @@ with gr.Blocks() as demo:
         df_output = gr.Dataframe(label="검색 결과")
         excel_output = gr.File(label="엑셀 다운로드")
-    # 버튼 클릭 시 process_keyword 함수를 실행 (두 개의 입력: 키워드, 체크박스 상태)
     search_button.click(fn=process_keyword, inputs=[keyword_input, include_checkbox], outputs=[df_output, excel_output])
 # 앱 실행 (Hugging Face Spaces 배포 가능)

 import tempfile
 import gradio as gr
+# 네이버 광고 API 호출 시 사용할 서명 생성 함수
 def generate_signature(timestamp, method, uri, secret_key):
     message = f"{timestamp}.{method}.{uri}"
     digest = hmac.new(secret_key.encode("utf-8"), message.encode("utf-8"), hashlib.sha256).digest()
     return base64.b64encode(digest).decode()
+# 네이버 광고 API 호출 헤더 생성 함수
 def get_header(method, uri, api_key, secret_key, customer_id):
     timestamp = str(round(time.time() * 1000))
     signature = generate_signature(timestamp, method, uri, secret_key)
         "X-Signature": signature
     }
+# 네이버 광고 API를 통해 단일 키워드의 연관검색어 및 검색량 정보를 가져오는 함수
 def fetch_related_keywords(keyword):
+    # 환경변수에서 광고 API 키값들을 불러옵니다.
     API_KEY = os.environ["NAVER_API_KEY"]
     SECRET_KEY = os.environ["NAVER_SECRET_KEY"]
     CUSTOMER_ID = os.environ["NAVER_CUSTOMER_ID"]
     uri = "/keywordstool"
     method = "GET"
     headers = get_header(method, uri, API_KEY, SECRET_KEY, CUSTOMER_ID)
     params = {
         "hintKeywords": [keyword],
         "showDetail": "1"
     if "keywordList" not in data:
         return pd.DataFrame()
     df = pd.DataFrame(data["keywordList"])
     if len(df) > 100:
         df = df.head(100)
     def parse_count(x):
         try:
             x_str = str(x).replace(",", "")
         except:
             return 0
     df["PC월검색량"] = df["monthlyPcQcCnt"].apply(parse_count)
     df["모바일월검색량"] = df["monthlyMobileQcCnt"].apply(parse_count)
     df["토탈월검색량"] = df["PC월검색량"] + df["모바일월검색량"]
     df.rename(columns={"relKeyword": "정보키워드"}, inplace=True)
     result_df = df[["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"]]
     return result_df
+# 네이버 검색 개발 API를 활용하여 블로그 문서수를 조회하는 함수
+def fetch_blog_count(keyword):
+    # 환경변수에서 네이버 검색 API 자격증명을 불러옵니다.
+    client_id = os.environ["NAVER_SEARCH_CLIENT_ID"]
+    client_secret = os.environ["NAVER_SEARCH_CLIENT_SECRET"]
+    url = "https://openapi.naver.com/v1/search/blog.json"
+    headers = {
+        "X-Naver-Client-Id": client_id,
+        "X-Naver-Client-Secret": client_secret
+    }
+    params = {"query": keyword, "display": 1}
+    response = requests.get(url, headers=headers, params=params)
+    if response.status_code == 200:
+        data = response.json()
+        return data.get("total", 0)
+    else:
+        return 0
 # 임시 엑셀 파일 생성 함수
 def create_excel_file(df):
     with tempfile.NamedTemporaryFile(suffix=".xlsx", delete=False) as tmp:
 # 입력된 여러 키워드를 처리하는 함수
 def process_keyword(keywords: str, include_related: bool):
     """
+    1. 텍스트박스에 엔터로 구분된 여러 키워드를 받아 각 키워드에 대해 네이버 광고 API를 통해 검색량 정보를 조회합니다.
+    2. 각 키워드에 대해 입력한 키워드 자체의 결과를 포함합니다.
+    3. 체크박스(True)인 경우, 첫 번째 키워드에 대해서만 연관검색어(입력 키워드를 제외한 결과)를 추가합니다.
+    4. 마지막으로, 각 "정보키워드"에 대해 네이버 검색 API를 호출하여 블로그 문서수를 조회하고 "블로그문서수" 컬럼에 추가합니다.
     """
     # 줄바꿈으로 분리하여 입력 키워드 리스트 생성 (빈 줄 제외)
     input_keywords = [k.strip() for k in keywords.splitlines() if k.strip() != ""]
         df_kw = fetch_related_keywords(kw)
         if df_kw.empty:
             continue
+        # 입력 키워드 자체의 결과를 우선 포함
         row_kw = df_kw[df_kw["정보키워드"] == kw]
         if not row_kw.empty:
             result_dfs.append(row_kw)
         else:
+            # 입력 키워드에 해당하는 행이 없으면 첫 번째 행을 대체로 추가
             result_dfs.append(df_kw.head(1))
+        # 체크박스가 True이고, 첫 번째 키워드에 대해서만 연관검색어 추가 (입력 키워드 제외)
         if include_related and idx == 0:
             df_related = df_kw[df_kw["정보키워드"] != kw]
             if not df_related.empty:
     if result_dfs:
         result_df = pd.concat(result_dfs, ignore_index=True)
         result_df.drop_duplicates(subset=["정보키워드"], inplace=True)
     else:
         result_df = pd.DataFrame(columns=["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"])
+    # 블로그 문서수 컬럼 추가: 각 정보키워드마다 네이버 블로그 검색 API로 총 문서수를 조회
+    result_df["블로그문서수"] = result_df["정보키워드"].apply(fetch_blog_count)
     result_df.sort_values(by="토탈월검색량", ascending=False, inplace=True)
     return result_df, create_excel_file(result_df)
 # Gradio UI 구성
 with gr.Blocks() as demo:
+    gr.Markdown("### 네이버 연관검색어 및 검색량, 블로그 문서수 조회 앱")
+    gr.Markdown(
+        "여러 키워드를 엔터로 구분하여 입력하면 각 키워드의 검색량 정보를 조회하고, "
+        "첫 번째 키워드의 경우 '연관검색어 포함' 체크 시 연관검색어도 함께 조회합니다. "
+        "또한, 각 정보키워드에 대한 네이버 블로그 문서수도 함께 출력됩니다."
+    )
     with gr.Row():
         keyword_input = gr.Textbox(label="키워드 입력 (여러 개일 경우 엔터로 구분)", lines=5, placeholder="예:\n강원도풀빌라\n자바스크립트")
         df_output = gr.Dataframe(label="검색 결과")
         excel_output = gr.File(label="엑셀 다운로드")
+    # 버튼 클릭 시 process_keyword 함수 실행
     search_button.click(fn=process_keyword, inputs=[keyword_input, include_checkbox], outputs=[df_output, excel_output])
 # 앱 실행 (Hugging Face Spaces 배포 가능)