Spaces:

VishnuRamDebyez
/

RAG_FASTAPI

Sleeping

App Files Files Community

VishnuRamDebyez commited on Mar 10

Commit

ab11098

verified ·

1 Parent(s): 0b10d8a

Update app.py

Browse files

Files changed (1) hide show

app.py +74 -69

app.py CHANGED Viewed

@@ -14,14 +14,16 @@ from qdrant_client import QdrantClient
 from qdrant_client.http.models import Distance, VectorParams
 from qdrant_client.models import PointIdsList
-from langgraph.graph import MessagesState, StateGraph, END
-from langgraph.checkpoint.memory import MemorySaver
 from langchain_core.messages import SystemMessage, HumanMessage
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
-# Load environment variables
 load_dotenv()
 GOOGLE_API_KEY = os.getenv('GOOGLE_API_KEY')
 GROQ_API_KEY = os.getenv('GROQ_API_KEY')
@@ -35,7 +37,7 @@ class QASystem:
     def __init__(self):
         self.vector_store = None
         self.graph = None
-        self.memory = MemorySaver()  # LangGraph memory saver for conversation history
         self.embeddings = None
         self.client = None
         self.pdf_dir = "pdfss"
@@ -43,10 +45,10 @@ class QASystem:
     def load_pdf_documents(self):
         documents = []
         pdf_dir = Path(self.pdf_dir)
         if not pdf_dir.exists():
             raise FileNotFoundError(f"PDF directory not found: {self.pdf_dir}")
         for pdf_path in pdf_dir.glob("*.pdf"):
             try:
                 loader = PyPDFLoader(str(pdf_path))
@@ -55,16 +57,18 @@ class QASystem:
             except Exception as e:
                 logger.error(f"Error loading PDF {pdf_path}: {str(e)}")
-        text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
         split_docs = text_splitter.split_documents(documents)
         logger.info(f"Split documents into {len(split_docs)} chunks")
         return split_docs
     def initialize_system(self):
         try:
-            # Qdrant setup
             self.client = QdrantClient(":memory:")
             try:
                 self.client.get_collection("pdf_data")
             except Exception:
@@ -73,88 +77,92 @@ class QASystem:
                     vectors_config=VectorParams(size=768, distance=Distance.COSINE),
                 )
                 logger.info("Created new collection: pdf_data")
-            # Embeddings and vector store
             self.embeddings = GoogleGenerativeAIEmbeddings(
-                model="models/embedding-001", google_api_key=GOOGLE_API_KEY
             )
             self.vector_store = QdrantVectorStore(
                 client=self.client,
                 collection_name="pdf_data",
                 embeddings=self.embeddings,
             )
-            # Load and add documents
             documents = self.load_pdf_documents()
             if documents:
-                points = self.client.scroll(collection_name="pdf_data", limit=100)[0]
-                if points:
-                    self.client.delete(
-                        collection_name="pdf_data",
-                        points_selector=PointIdsList(points=[p.id for p in points])
-                    )
                 self.vector_store.add_documents(documents)
                 logger.info(f"Added {len(documents)} documents to vector store")
-            # LLM setup
             llm = ChatGroq(
-                model="llama3-8b-8192",
                 api_key=GROQ_API_KEY,
                 temperature=0.7
             )
-            # Graph building
             graph_builder = StateGraph(MessagesState)
-            # === TOOL NODE for context fetching from Qdrant ===
-            def retrieve_documents(state: MessagesState):
-                query = [m.content for m in state["messages"] if m.type == "human"][-1]
-                results = self.vector_store.similarity_search(query, k=4)
-                context = "\n\n".join([doc.page_content for doc in results])
-                return {"messages": [SystemMessage(content=context, name="retrieval")]}  # as tool message
-            # === GENERATOR NODE that uses full memory (chat history) ===
-            def generate_response(state: MessagesState):
-                # Get full history from memory
-                thread_id = state["configurable"].get("thread_id", "default")
-                history = self.memory.get_memory(thread_id).get("messages", [])
-                logger.info(f"[Thread {thread_id}] History: {[m.content for m in history]}")
-                # Add current turn messages
-                all_messages = history + state["messages"]
-                # Extract context from retrieved docs (tool messages)
-                retrieved_docs = [m for m in all_messages if m.type == "tool"]
                 context = ' '.join(m.content for m in retrieved_docs) if retrieved_docs else "mountain bicycle documentation knowledge"
-                # Compose system prompt
                 system_prompt = (
                     "You are an AI assistant embedded within the Interactive Electronic Technical Manual (IETM) for Mountain Cycles. "
-                    "Your responses MUST be accurate, concise (5 sentences max). "
-                    "If you don't know the answer, say 'I don't know based on available data.'\n\n"
-                    f"Context:\n{context}"
                 )
-                final_messages = [SystemMessage(content=system_prompt)] + all_messages
-                response = llm.invoke(final_messages)
-                # Save updated chat to memory
-                self.memory.save_checkpoint(thread_id, {"messages": all_messages + [response]})
                 return {"messages": [response]}
-            # Add graph nodes
-            graph_builder.add_node("retrieval", retrieve_documents)
-            graph_builder.add_node("generate", generate_response)
-            # Graph edges
-            graph_builder.set_entry_point("retrieval")
-            graph_builder.add_edge("retrieval", "generate")
             graph_builder.add_edge("generate", END)
-            # Compile graph with memory
             self.graph = graph_builder.compile(checkpointer=self.memory)
             return True
@@ -162,14 +170,13 @@ class QASystem:
             logger.error(f"System initialization error: {str(e)}")
             return False
-    # === Query Processor with Memory ===
-    def process_query(self, query: str, user_id: str) -> List[Dict[str, str]]:
         try:
             responses = []
             for step in self.graph.stream(
                 {"messages": [HumanMessage(content=query)]},
                 stream_mode="values",
-                config={"configurable": {"thread_id": user_id}}  # thread ID for user memory
             ):
                 if step["messages"]:
                     responses.append({
@@ -181,15 +188,13 @@ class QASystem:
             logger.error(f"Query processing error: {str(e)}")
             return [{'content': f"Query processing error: {str(e)}", 'type': 'error'}]
-# === Initialize QA System ===
 qa_system = QASystem()
 if qa_system.initialize_system():
     logger.info("QA System Initialized Successfully")
 else:
     raise RuntimeError("Failed to initialize QA System")
-# === FastAPI Route ===
 @app.post("/query")
-async def query_api(query: str, user_id: str):  # Pass user_id for session-specific memory
-    responses = qa_system.process_query(query, user_id)
     return {"responses": responses}

 from qdrant_client.http.models import Distance, VectorParams
 from qdrant_client.models import PointIdsList
+from langgraph.graph import MessagesState, StateGraph
 from langchain_core.messages import SystemMessage, HumanMessage
+from langgraph.prebuilt import ToolNode
+from langgraph.graph import END
+from langgraph.prebuilt import tools_condition
+from langgraph.checkpoint.memory import MemorySaver
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 load_dotenv()
 GOOGLE_API_KEY = os.getenv('GOOGLE_API_KEY')
 GROQ_API_KEY = os.getenv('GROQ_API_KEY')
     def __init__(self):
         self.vector_store = None
         self.graph = None
+        self.memory = None
         self.embeddings = None
         self.client = None
         self.pdf_dir = "pdfss"
     def load_pdf_documents(self):
         documents = []
         pdf_dir = Path(self.pdf_dir)
         if not pdf_dir.exists():
             raise FileNotFoundError(f"PDF directory not found: {self.pdf_dir}")
         for pdf_path in pdf_dir.glob("*.pdf"):
             try:
                 loader = PyPDFLoader(str(pdf_path))
             except Exception as e:
                 logger.error(f"Error loading PDF {pdf_path}: {str(e)}")
+        text_splitter = RecursiveCharacterTextSplitter(
+            chunk_size=1000,
+            chunk_overlap=100
+        )
         split_docs = text_splitter.split_documents(documents)
         logger.info(f"Split documents into {len(split_docs)} chunks")
         return split_docs
     def initialize_system(self):
         try:
             self.client = QdrantClient(":memory:")
             try:
                 self.client.get_collection("pdf_data")
             except Exception:
                     vectors_config=VectorParams(size=768, distance=Distance.COSINE),
                 )
                 logger.info("Created new collection: pdf_data")
             self.embeddings = GoogleGenerativeAIEmbeddings(
+                model="models/embedding-001",
+                google_api_key=GOOGLE_API_KEY
             )
             self.vector_store = QdrantVectorStore(
                 client=self.client,
                 collection_name="pdf_data",
                 embeddings=self.embeddings,
             )
             documents = self.load_pdf_documents()
             if documents:
+                try:
+                    points = self.client.scroll(collection_name="pdf_data", limit=100)[0]
+                    if points:
+                        self.client.delete(
+                            collection_name="pdf_data",
+                            points_selector=PointIdsList(
+                                points=[p.id for p in points]
+                            )
+                        )
+                except Exception as e:
+                    logger.error(f"Error clearing vectors: {str(e)}")
                 self.vector_store.add_documents(documents)
                 logger.info(f"Added {len(documents)} documents to vector store")
             llm = ChatGroq(
+                model="llama3-8b-8192",
                 api_key=GROQ_API_KEY,
                 temperature=0.7
             )
             graph_builder = StateGraph(MessagesState)
+            def query_or_respond(state: MessagesState):
+                retrieved_docs = [m for m in state["messages"] if m.type == "tool"]
+                if retrieved_docs:
+                    context = ' '.join(m.content for m in retrieved_docs)
+                else:
+                    context = "mountain bicycle documentation knowledge"
+                system_prompt = (
+                    "You are an AI assistant embedded within the Interactive Electronic Technical Manual (IETM) for Mountain Cycles.. "
+                    "Always provide accurate responses with references to provided data. "
+                    "If the user query is not technical-specific, still respond from a IETM perspective."
+                    f"\n\nContext:\n{context}"
+                )
+                messages = [SystemMessage(content=system_prompt)] + state["messages"]
+                logger.info(f"Sending to LLM: {[m.content for m in messages]}")  # Debugging log
+                response = llm.invoke(messages)
+                return {"messages": [response]}
+            def generate(state: MessagesState):
+                retrieved_docs = [m for m in reversed(state["messages"]) if m.type == "tool"][::-1]
                 context = ' '.join(m.content for m in retrieved_docs) if retrieved_docs else "mountain bicycle documentation knowledge"
                 system_prompt = (
                     "You are an AI assistant embedded within the Interactive Electronic Technical Manual (IETM) for Mountain Cycles. "
+                    "Your responses MUST be accurate, concise (5 sentences max)."
+                    f"\n\nContext:\n{context}"
                 )
+                messages = [SystemMessage(content=system_prompt)] + state["messages"]
+                logger.info(f"Sending to LLM: {[m.content for m in messages]}")  # Debugging log
+                response = llm.invoke(messages)
                 return {"messages": [response]}
+            graph_builder.add_node("query_or_respond", query_or_respond)
+            graph_builder.add_node("generate", generate)
+            graph_builder.set_entry_point("query_or_respond")
+            graph_builder.add_edge("query_or_respond", "generate")
             graph_builder.add_edge("generate", END)
+            self.memory = MemorySaver()
             self.graph = graph_builder.compile(checkpointer=self.memory)
             return True
             logger.error(f"System initialization error: {str(e)}")
             return False
+    def process_query(self, query: str) -> List[Dict[str, str]]:
         try:
             responses = []
             for step in self.graph.stream(
                 {"messages": [HumanMessage(content=query)]},
                 stream_mode="values",
+                config={"configurable": {"thread_id": "abc123"}}
             ):
                 if step["messages"]:
                     responses.append({
             logger.error(f"Query processing error: {str(e)}")
             return [{'content': f"Query processing error: {str(e)}", 'type': 'error'}]
 qa_system = QASystem()
 if qa_system.initialize_system():
     logger.info("QA System Initialized Successfully")
 else:
     raise RuntimeError("Failed to initialize QA System")
 @app.post("/query")
+async def query_api(query: str):
+    responses = qa_system.process_query(query)
     return {"responses": responses}