Spaces:

terapyon
/

nvdajp-book-qa

Paused

App Files Files Community

terapyon commited on Jul 30, 2023

Commit

33db183

1 Parent(s): 3ec177b

can select model for GPT-4

Browse files

Files changed (1) hide show

app.py +23 -4

app.py CHANGED Viewed

@@ -2,6 +2,7 @@ import gradio as gr
 from langchain.chains import RetrievalQA
 from langchain.embeddings import OpenAIEmbeddings
 from langchain.llms import OpenAI
 from langchain.vectorstores import Qdrant
 from openai.error import InvalidRequestError
 from qdrant_client import QdrantClient
@@ -9,13 +10,24 @@ from config import DB_CONFIG
 PERSIST_DIR_NAME = "nvdajp-book"
-def get_retrieval_qa(temperature: int, option: str) -> RetrievalQA:
     embeddings = OpenAIEmbeddings()
     db_url, db_api_key, db_collection_name = DB_CONFIG
     client = QdrantClient(url=db_url, api_key=db_api_key)
     db = Qdrant(client=client, collection_name=db_collection_name, embeddings=embeddings)
     if option is None or option == "All":
         retriever = db.as_retriever()
     else:
@@ -25,7 +37,13 @@ def get_retrieval_qa(temperature: int, option: str) -> RetrievalQA:
             }
         )
     return RetrievalQA.from_chain_type(
-        llm=OpenAI(temperature=temperature), chain_type="stuff", retriever=retriever, return_source_documents=True,
     )
@@ -42,8 +60,8 @@ def get_related_url(metadata):
         yield f'<p>URL: <a href="{url}">{url}</a> (category: {category})</p>'
-def main(query: str, option: str, temperature: int):
-    qa = get_retrieval_qa(temperature, option)
     try:
         result = qa(query)
     except InvalidRequestError as e:
@@ -59,6 +77,7 @@ nvdajp_book_qa = gr.Interface(
     fn=main,
     inputs=[
         gr.Textbox(label="query"),
         gr.Radio(["All", "ja-book", "ja-nvda-user-guide", "en-nvda-user-guide"], label="絞り込み", info="ドキュメント制限する?"),
         gr.Slider(0, 2)
     ],

 from langchain.chains import RetrievalQA
 from langchain.embeddings import OpenAIEmbeddings
 from langchain.llms import OpenAI
+from langchain.chat_models import ChatOpenAI
 from langchain.vectorstores import Qdrant
 from openai.error import InvalidRequestError
 from qdrant_client import QdrantClient
 PERSIST_DIR_NAME = "nvdajp-book"
+# MODEL_NAME = "text-davinci-003"
+# MODEL_NAME = "gpt-3.5-turbo"
+# MODEL_NAME = "gpt-4"
+def get_retrieval_qa(model_name: str | None, temperature: int, option: str | None) -> RetrievalQA:
     embeddings = OpenAIEmbeddings()
     db_url, db_api_key, db_collection_name = DB_CONFIG
     client = QdrantClient(url=db_url, api_key=db_api_key)
     db = Qdrant(client=client, collection_name=db_collection_name, embeddings=embeddings)
+    if model_name is None:
+        model = "gpt-3.5-turbo"
+    elif model_name == "GPT-3.5":
+        model = "gpt-3.5-turbo"
+    elif model_name == "GPT-4":
+        model = "gpt-4"
+    else:
+        model = "gpt-3.5-turbo"
     if option is None or option == "All":
         retriever = db.as_retriever()
     else:
             }
         )
     return RetrievalQA.from_chain_type(
+        llm=ChatOpenAI(
+            model=model,
+            temperature=temperature
+        ),
+        chain_type="stuff",
+        retriever=retriever,
+        return_source_documents=True,
     )
         yield f'<p>URL: <a href="{url}">{url}</a> (category: {category})</p>'
+def main(query: str, model_name: str, option: str, temperature: int):
+    qa = get_retrieval_qa(model_name, temperature, option)
     try:
         result = qa(query)
     except InvalidRequestError as e:
     fn=main,
     inputs=[
         gr.Textbox(label="query"),
+        gr.Radio(["GPT-3.5", "GPT-4"], label="Model", info="選択なしで「3.5」を使用"),
         gr.Radio(["All", "ja-book", "ja-nvda-user-guide", "en-nvda-user-guide"], label="絞り込み", info="ドキュメント制限する?"),
         gr.Slider(0, 2)
     ],