Spaces:

AtPeak
/

japanese-address-search-v2

Sleeping

App Files Files Community

matsuap commited on Apr 27

Commit

ec20668

1 Parent(s): b0f617e

Milvusを使用したベクトル検索機能の追加と、環境変数からの設定読み込みを実装。埋め込みモデルの推論エンドポイントへのリトライ機能を追加。

Browse files

Files changed (3) hide show

.env +5 -0
app.py +91 -37
requirements.txt +2 -6

.env ADDED Viewed

	@@ -0,0 +1,5 @@

+EMBEDDING_MODEL_ENDPOINT=https://osyd05gsoix24h2p.us-east-1.aws.endpoints.huggingface.cloud
+ABRG_ENDPOINT=https://abrg-api-770258656166.asia-northeast1.run.app
+VECTOR_SEARCH_ENDPOINT=https://in03-61f450c72e52352.serverless.gcp-us-west1.cloud.zilliz.com
+VECTOR_SEARCH_TOKEN=87ae2d391f7ef8595b0f37bbde8785cb267d001284492ceaec2d0b5967ba5af5c1733a61f3e151381c908477b05d88a20696876a
+VECTOR_SEARCH_COLLECTION_NAME=japanese_address

app.py CHANGED Viewed

@@ -1,15 +1,14 @@
 import gradio as gr
 import requests
 import pandas as pd
-import faiss
-from tqdm import tqdm
 import os
-import numpy as np
-from sentence_transformers import SentenceTransformer
-from huggingface_hub import snapshot_download
 from fastapi import FastAPI
-CUSTOM_PATH = "/gradio"
 app = FastAPI()
@@ -19,15 +18,20 @@ app = FastAPI()
 # 環境変数からHUGGING_FACE_TOKENを取得
 HUGGING_FACE_TOKEN = os.environ.get('HUGGING_FACE_TOKEN')
-ABRG_ENDPOINT = 'https://abrg-api-770258656166.asia-northeast1.run.app'
-repo_id = 'AtPeak/japanese-address-machiaza-vector'
-# repo_id = 'AtPeak/japanese-address-resident-number-vector'
-data_dir = 'embeddings'
-if not os.path.exists(data_dir):
-    snapshot_download(repo_id=repo_id, local_dir=data_dir, use_auth_token=HUGGING_FACE_TOKEN)
-model = SentenceTransformer('intfloat/multilingual-e5-large', device='cuda')
 # 47都道府県のリスト
 prefs = [
@@ -66,30 +70,62 @@ examples = [
         '少し待ってください。',
 ]
-def init_faiss():
-    index = faiss.IndexFlatIP(1024)
-    all_addresses = []
-    for pref in tqdm(prefs):
-        with np.load(f'{data_dir}/pref/{pref}.npz') as data:
-            address_embeds = data['embeds']
-            addresses = data['addresses']
-        faiss.normalize_L2(address_embeds)
-        index.add(address_embeds)
-        # 後で検索結果と照合する用
-        all_addresses.extend(addresses.tolist())  # numpy.str_ -> str に変換される
-    return index, all_addresses
 def preprocess(text):
     text = text.replace('◯', '0')
     return text
-def search_via_faiss(query_embed, top_k):
-    faiss.normalize_L2(query_embed)
-    D, I = index.search(query_embed, top_k)
-    return [(k, d, all_addresses[i]) for k, (d, i) in enumerate(zip(D[0], I[0]), start=1)]
 with gr.Blocks() as demo:
     with gr.Tab("デジ庁API"):
@@ -141,13 +177,31 @@ with gr.Blocks() as demo:
                 search_button = gr.Button(value='検索', variant='primary')
         result_dataframe = gr.Dataframe(label="検索結果")
-        index, all_addresses = init_faiss()
         def search_address(query_address, top_k):
             query_address = preprocess(query_address)
-            query_embed = model.encode([query_address], convert_to_numpy=True)
-            hits = search_via_faiss(query_embed, top_k)
             df = pd.DataFrame(hits, columns=['Top-k', '類似度', '住所'])
             return df

 import gradio as gr
+import time
 import requests
 import pandas as pd
 import os
 from fastapi import FastAPI
+from pymilvus import MilvusClient
+from dotenv import load_dotenv
+# .envファイルを読み込む
+load_dotenv()
 app = FastAPI()
 # 環境変数からHUGGING_FACE_TOKENを取得
 HUGGING_FACE_TOKEN = os.environ.get('HUGGING_FACE_TOKEN')
+EMBEDDING_MODEL_ENDPOINT = os.environ.get('EMBEDDING_MODEL_ENDPOINT')
+ABRG_ENDPOINT = os.environ.get('ABRG_ENDPOINT')
+VECTOR_SEARCH_ENDPOINT = os.environ.get('VECTOR_SEARCH_ENDPOINT')
+VECTOR_SEARCH_TOKEN = os.environ.get('VECTOR_SEARCH_TOKEN')
+VECTOR_SEARCH_COLLECTION_NAME = os.environ.get('VECTOR_SEARCH_COLLECTION_NAME')
+def init_milvus():
+    milvus_client = MilvusClient(uri=VECTOR_SEARCH_ENDPOINT, token=VECTOR_SEARCH_TOKEN)
+    print(f"Connected to DB: {VECTOR_SEARCH_ENDPOINT} successfully")
+    return milvus_client
+MILVUS_CLIENT = init_milvus()
 # 47都道府県のリスト
 prefs = [
         '少し待ってください。',
 ]
 def preprocess(text):
     text = text.replace('◯', '0')
     return text
+from enum import Enum
+class InferenceEndpointErrorCode(Enum):
+    INVALID_STATE = 400
+    SERVICE_UNAVAILABLE = 503
+    UNKNOWN_ERROR = 520
+class InferenceEndpointError(Exception):
+    def __init__(self, code: InferenceEndpointErrorCode, message="エラー"):
+        self.code = code
+        self.message = message
+        super().__init__(self.message)
+def embed_via_multilingual_e5_large(query_addresses):
+    headers = {
+        "Accept" : "application/json",
+        "Authorization": f"Bearer {HUGGING_FACE_TOKEN}",
+        "Content-Type": "application/json"
+    }
+    response = requests.post(EMBEDDING_MODEL_ENDPOINT, headers=headers, json={"inputs": query_addresses})
+    response_json = response.json()
+    if 'error' in response_json:
+        if response_json['error'] == 'Bad Request: Invalid state':
+            raise InferenceEndpointError(InferenceEndpointErrorCode.INVALID_STATE, "Bad Request: Invalid state")
+        elif response_json['error'] == '503 Service Unavailable':
+            raise InferenceEndpointError(InferenceEndpointErrorCode.SERVICE_UNAVAILABLE, "Service Unavailable")
+        else:
+            raise InferenceEndpointError(InferenceEndpointErrorCode.UNKNOWN_ERROR, response_json['error'])
+    return response_json
+def search_via_milvus(query_vector, top_k):
+    search_params = {"metric_type": "COSINE", "params": {"nprobe": 10}}  # MiniLM系はCOSINE推奨
+    results = MILVUS_CLIENT.search(
+        collection_name=VECTOR_SEARCH_COLLECTION_NAME,
+        data=[query_vector],
+        search_params=search_params,
+        limit=top_k,
+        anns_field='embedding',
+        output_fields=['address'],
+    )[0]
+    hits = []
+    for i, result in enumerate(results, start=1):
+        distance = result['distance']
+        address = result['entity'].get('address')
+        hits.append([i, distance, address])
+    return hits
 with gr.Blocks() as demo:
     with gr.Tab("デジ庁API"):
                 search_button = gr.Button(value='検索', variant='primary')
         result_dataframe = gr.Dataframe(label="検索結果")
         def search_address(query_address, top_k):
             query_address = preprocess(query_address)
+            wait_time = 30
+            max_retries = 5
+            for attempt in range(max_retries):
+                try:
+                    query_embeds = embed_via_multilingual_e5_large([query_address])
+                    break  # 成功した場合はループを抜ける
+                except InferenceEndpointError as e:
+                    if e.code == InferenceEndpointErrorCode.SERVICE_UNAVAILABLE:
+                        if attempt < max_retries - 1:
+                            gr.Warning(f"{InferenceEndpointErrorCode.SERVICE_UNAVAILABLE}: 埋め込みモデルの推論エンドポイントが起動中です。{wait_time}秒後にリトライします。", duration=wait_time)
+                            time.sleep(wait_time)  # 30秒待機
+                        else:
+                            raise gr.Error(f"{InferenceEndpointErrorCode.SERVICE_UNAVAILABLE}: 最大リトライ回数に達しました。しばらくしてから再度実行してみてください。")
+                    elif e.code == InferenceEndpointErrorCode.INVALID_STATE:
+                        raise gr.Error(f"{InferenceEndpointErrorCode.INVALID_STATE}: 埋め込みモデルの推論エンドポイントが停止中です。再起動するよう管理者に問い合わせてください。")
+                    elif e.code == InferenceEndpointErrorCode.UNKNOWN_ERROR:
+                        raise gr.Error(f"{InferenceEndpointErrorCode.UNKNOWN_ERROR}: {e.message}")
+            hits = search_via_milvus(query_embeds[0], top_k)
             df = pd.DataFrame(hits, columns=['Top-k', '類似度', '住所'])
             return df

requirements.txt CHANGED Viewed

@@ -1,11 +1,7 @@
---extra-index-url https://download.pytorch.org/whl/cu118
 gradio
 pandas
 numpy
-faiss-cpu
-sentence-transformers
 huggingface-hub
-torch==2.5.1
 fastapi
-uvicorn

 gradio
 pandas
 numpy
 huggingface-hub
 fastapi
+uvicorn
+pymilvus