Update main.py
Browse files
main.py
CHANGED
|
@@ -19,7 +19,7 @@ from langchain.callbacks.base import BaseCallbackHandler
|
|
| 19 |
from langchain.chains import (
|
| 20 |
StuffDocumentsChain, ConversationalRetrievalChain
|
| 21 |
)
|
| 22 |
-
from langchain_core.tracers.context import tracing_v2_enabled
|
| 23 |
#from langchain_core.tools import Tool
|
| 24 |
|
| 25 |
import chainlit as cl
|
|
@@ -31,8 +31,8 @@ from deep_translator import GoogleTranslator
|
|
| 31 |
|
| 32 |
from datetime import timedelta
|
| 33 |
|
| 34 |
-
from literalai import
|
| 35 |
-
|
| 36 |
|
| 37 |
@cl.password_auth_callback
|
| 38 |
def auth_callback(username: str, password: str):
|
|
@@ -51,7 +51,8 @@ def auth_callback(username: str, password: str):
|
|
| 51 |
identifier=ident + " : 🧑🎓 User Datapcc", metadata={"role": "user", "provider": "credentials"}
|
| 52 |
)
|
| 53 |
|
| 54 |
-
|
|
|
|
| 55 |
os.environ['HUGGINGFACEHUB_API_TOKEN'] = os.environ['HUGGINGFACEHUB_API_TOKEN']
|
| 56 |
repo_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
|
| 57 |
llm = HuggingFaceEndpoint(
|
|
@@ -71,7 +72,8 @@ def LLModel():
|
|
| 71 |
#)
|
| 72 |
return llm
|
| 73 |
|
| 74 |
-
|
|
|
|
| 75 |
if categorie == "bibliographie-OPP-DGDIN":
|
| 76 |
index_name = "all-venus"
|
| 77 |
embeddings = HuggingFaceEmbeddings()
|
|
@@ -93,8 +95,9 @@ def VectorDatabase(categorie):
|
|
| 93 |
|
| 94 |
return vectorstore
|
| 95 |
|
| 96 |
-
|
| 97 |
-
|
|
|
|
| 98 |
if categorie == "bibliographie-OPP-DGDIN":
|
| 99 |
retriever = vectorstore.as_retriever(search_type="similarity_score_threshold", search_kwargs={"score_threshold": .7, "k": 150,"filter": {'categorie': {'$eq': categorie}}})
|
| 100 |
elif categorie == "year":
|
|
@@ -105,8 +108,9 @@ def Retriever(categorie):
|
|
| 105 |
retriever = vectorstore.as_retriever(search_type="similarity_score_threshold", search_kwargs={"score_threshold": .7, "k": 200,"filter": {"title": {"$eq": "videos-confinement-timeline"}}})
|
| 106 |
return retriever
|
| 107 |
|
| 108 |
-
|
| 109 |
-
|
|
|
|
| 110 |
results = []
|
| 111 |
test = []
|
| 112 |
sources_text = ""
|
|
@@ -214,13 +218,15 @@ async def on_chat_start():
|
|
| 214 |
message_history = ChatMessageHistory()
|
| 215 |
memory = ConversationBufferMemory(memory_key="chat_history",output_key="answer",chat_memory=message_history,return_messages=True)
|
| 216 |
|
|
|
|
|
|
|
| 217 |
qa = ConversationalRetrievalChain.from_llm(
|
| 218 |
-
|
| 219 |
memory=memory,
|
| 220 |
chain_type="stuff",
|
| 221 |
return_source_documents=True,
|
| 222 |
verbose=False,
|
| 223 |
-
retriever=
|
| 224 |
)
|
| 225 |
cl.user_session.set("runnable", qa)
|
| 226 |
cl.user_session.set("memory", memory)
|
|
@@ -254,11 +260,10 @@ async def on_message(message: cl.Message):
|
|
| 254 |
cl.Text(name="Sources", content=sources_text, display="inline")
|
| 255 |
)
|
| 256 |
|
| 257 |
-
|
| 258 |
cb = cl.AsyncLangchainCallbackHandler()
|
| 259 |
-
|
| 260 |
-
|
| 261 |
-
answer = results["answer"]
|
| 262 |
|
| 263 |
await cl.Message(content=GoogleTranslator(source='auto', target='fr').translate(answer)).send()
|
| 264 |
|
|
|
|
| 19 |
from langchain.chains import (
|
| 20 |
StuffDocumentsChain, ConversationalRetrievalChain
|
| 21 |
)
|
| 22 |
+
#from langchain_core.tracers.context import tracing_v2_enabled
|
| 23 |
#from langchain_core.tools import Tool
|
| 24 |
|
| 25 |
import chainlit as cl
|
|
|
|
| 31 |
|
| 32 |
from datetime import timedelta
|
| 33 |
|
| 34 |
+
from literalai import AsyncLiteralClient
|
| 35 |
+
async_literal_client = AsyncLiteralClient(api_key=os.getenv("LITERAL_API_KEY"))
|
| 36 |
|
| 37 |
@cl.password_auth_callback
|
| 38 |
def auth_callback(username: str, password: str):
|
|
|
|
| 51 |
identifier=ident + " : 🧑🎓 User Datapcc", metadata={"role": "user", "provider": "credentials"}
|
| 52 |
)
|
| 53 |
|
| 54 |
+
@cl.step(type="llm")
|
| 55 |
+
async def LLModel():
|
| 56 |
os.environ['HUGGINGFACEHUB_API_TOKEN'] = os.environ['HUGGINGFACEHUB_API_TOKEN']
|
| 57 |
repo_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
|
| 58 |
llm = HuggingFaceEndpoint(
|
|
|
|
| 72 |
#)
|
| 73 |
return llm
|
| 74 |
|
| 75 |
+
@cl.step(type="tool")
|
| 76 |
+
async def VectorDatabase(categorie):
|
| 77 |
if categorie == "bibliographie-OPP-DGDIN":
|
| 78 |
index_name = "all-venus"
|
| 79 |
embeddings = HuggingFaceEmbeddings()
|
|
|
|
| 95 |
|
| 96 |
return vectorstore
|
| 97 |
|
| 98 |
+
@cl.step(type="retrieval")
|
| 99 |
+
async def Retriever(categorie):
|
| 100 |
+
vectorstore = await VectorDatabase(categorie)
|
| 101 |
if categorie == "bibliographie-OPP-DGDIN":
|
| 102 |
retriever = vectorstore.as_retriever(search_type="similarity_score_threshold", search_kwargs={"score_threshold": .7, "k": 150,"filter": {'categorie': {'$eq': categorie}}})
|
| 103 |
elif categorie == "year":
|
|
|
|
| 108 |
retriever = vectorstore.as_retriever(search_type="similarity_score_threshold", search_kwargs={"score_threshold": .7, "k": 200,"filter": {"title": {"$eq": "videos-confinement-timeline"}}})
|
| 109 |
return retriever
|
| 110 |
|
| 111 |
+
@cl.step(type="embedding")
|
| 112 |
+
async def Search(input, categorie):
|
| 113 |
+
vectorstore = await VectorDatabase(categorie)
|
| 114 |
results = []
|
| 115 |
test = []
|
| 116 |
sources_text = ""
|
|
|
|
| 218 |
message_history = ChatMessageHistory()
|
| 219 |
memory = ConversationBufferMemory(memory_key="chat_history",output_key="answer",chat_memory=message_history,return_messages=True)
|
| 220 |
|
| 221 |
+
model = await LLModel()
|
| 222 |
+
retriever = await Retriever(res.get("name"))
|
| 223 |
qa = ConversationalRetrievalChain.from_llm(
|
| 224 |
+
model,
|
| 225 |
memory=memory,
|
| 226 |
chain_type="stuff",
|
| 227 |
return_source_documents=True,
|
| 228 |
verbose=False,
|
| 229 |
+
retriever=retriever
|
| 230 |
)
|
| 231 |
cl.user_session.set("runnable", qa)
|
| 232 |
cl.user_session.set("memory", memory)
|
|
|
|
| 260 |
cl.Text(name="Sources", content=sources_text, display="inline")
|
| 261 |
)
|
| 262 |
|
| 263 |
+
with literal_client.thread() as thread:
|
| 264 |
cb = cl.AsyncLangchainCallbackHandler()
|
| 265 |
+
results = await runnable.acall("Contexte : Vous êtes un chercheur de l'enseignement supérieur et vous êtes doué pour faire des analyses d'articles de recherche sur les thématiques liées à la pédagogie, en fonction des critères définis ci-avant. En fonction des informations suivantes et du contexte suivant seulement et strictement, répondez en langue française strictement à la question ci-dessous à partir du contexte ci-dessous. En plus, tu créeras et tu afficheras 3 questions supplémentaires en relation avec le contexte initial, à chaque étape de la conversation. Tu écriras et tu afficheras les 3 questions supplémentaires en relation avec le contexte initial, avec un titrage de niveau 1 qui a pour titre \"Questions en relation avec le contexte : \". Lorsque cela est possible, cite les sources du contexte. Si vous ne pouvez pas répondre à la question sur la base des informations, dites que vous ne trouvez pas de réponse ou que vous ne parvenez pas à trouver de réponse. Essayez donc de comprendre en profondeur le contexte et répondez uniquement en vous basant sur les informations fournies. Ne générez pas de réponses non pertinentes. Question : " + message.content, callbacks=[cb])
|
| 266 |
+
answer = results["answer"]
|
|
|
|
| 267 |
|
| 268 |
await cl.Message(content=GoogleTranslator(source='auto', target='fr').translate(answer)).send()
|
| 269 |
|