Final_Assignment_Template

Sleeping

App Files Files Community

Freddolin commited on Jul 10

Commit

e0fa687

verified ·

1 Parent(s): 5c47ee8

Update agent.py

Browse files

Files changed (1) hide show

agent.py +221 -114

agent.py CHANGED Viewed

@@ -1,118 +1,225 @@
 import os
-import torch
-from huggingface_hub import InferenceClient
-# Importera LangChain-komponenter
-from langchain_community.llms import HuggingFaceHub # För att använda HF Inference API som LLM
-from langchain.agents import AgentExecutor, create_react_agent # Agentens exekverare och ReAct-agent konstruktorn
-from langchain.tools import Tool # Verktygsklassen i LangChain
-from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
-from langchain_core.messages import HumanMessage, AIMessage
-# Importera dina befintliga, anpassade verktygsfunktioner
-from tavily_search import search_tavily
-from asr_tool import transcribe_audio
-from excel_tool import analyze_excel
-from math_tool import calculate_math
-class GaiaAgent:
-    def __init__(self, model_id: str = "google/gemma-2b-it"):
-        """
-        Initialiserar GaiaAgent, nu med LangChain.
-        """
-        print(f"Initialiserar GaiaAgent med modell: {model_id}")
-        hf_token = os.getenv("HF_TOKEN") or os.getenv("HUGGING_FACE_HUB_TOKEN")
-        if not hf_token:
-            raise ValueError(
-                "Hugging Face token (HF_TOKEN eller HUGGING_FACE_HUB_TOKEN) är inte konfigurerad i miljövariabler."
-                "Vänligen lägg till din token som en 'Repository secret' i dina Space-inställningar."
-            )
-        # 1. Initialisera LLM med LangChain's HuggingFaceHub
-        try:
-            # HuggingFaceHub ansluter till en fjärrmodell via HF Inference API
-            self.llm = HuggingFaceHub(
-                repo_id=model_id,
-                huggingfacehub_api_token=hf_token,
-                task="text-generation", # Specifiera task
-                # model_kwargs={"temperature": 0.1, "max_new_tokens": 512} # Exempel på modell-kwargs
-            )
-            print("LangChain HuggingFaceHub LLM laddad framgångsrikt.")
-        except Exception as e:
-            raise RuntimeError(
-                f"Misslyckades att initialisera HuggingFaceHub LLM: {e}."
-                "Vänligen kontrollera din HF token och att modellen är tillgänglig/laddningsbar."
-            )
-        # 2. Definiera dina anpassade verktyg som LangChain Tool-objekt
-        tools_list = [
-            Tool.from_function(
-                func=search_tavily,
-                name="search_tavily",
-                description="Användbart för att söka information online med Tavily Search. Returnerar en sammanfattning av de mest relevanta resultaten från webben. Kräver en fråga som input.",
-            ),
-            Tool.from_function(
-                func=transcribe_audio,
-                name="transcribe_audio",
-                description="Transkriberar ljudfil till text. Användbart för att omvandla tal till text från en angiven ljudfilsväg. Kräver en filsökväg till ljudfilen som input.",
-            ),
-            Tool.from_function(
-                func=analyze_excel,
-                name="analyze_excel",
-                description="Analysera Excel-filer och returnera detaljerad information om rader, kolumner, datatyper och statistik (summa, medelvärde, max, min för numeriska kolumner). Kan ta både en lokal filväg eller en URL till Excel-filen som input.",
             ),
-            Tool.from_function(
-                func=calculate_math,
-                name="calculate_math",
-                description="Beräkna matematiska uttryck. Användbart för att utföra aritmetiska operationer som addition, subtraktion, multiplikation, division och potenser. Tar ett matematiskt uttryck som en sträng som input.",
-            )
-        ]
-        print(f"Laddade {len(tools_list)} anpassade verktyg för LangChain.")
-        # 3. Skapa en prompt för ReAct-agenten
-        # Detta prompt-format är viktigt för hur LLM:en förstår att använda verktyg.
-        # MessagesPlaceholder används för att injicera verktyg och meddelandehistorik dynamiskt.
-        prompt = ChatPromptTemplate.from_messages(
-            [
-                ("system", "Du är en hjälpsam AI-assistent. Använd tillgängliga verktyg för att svara på frågor."),
-                MessagesPlaceholder("chat_history", optional=True),
-                ("human", "{input}"),
-                MessagesPlaceholder("agent_scratchpad"), # Detta är där agentens tankar och verktygskall kommer att finnas
-            ]
         )
-        # 4. Initialisera LangChain ReAct-agenten
-        # create_react_agent är en konstruktorfunktion för en ReAct-baserad agent
-        agent = create_react_agent(self.llm, tools_list, prompt)
-        # 5. Skapa AgentExecutor för att köra agenten
-        # AgentExecutor är den körbara delen som hanterar agentens "tankeloop" och verktygskall
-        self.agent_executor = AgentExecutor(
-            agent=agent,
-            tools=tools_list,
-            verbose=True, # Sätt till True för att se agentens tankeprocess i loggarna
-            handle_parsing_errors=True # Hantera parsningsfel graciöst
-        )
-        print("LangChain AgentExecutor initialiserad.")
-    def process_task(self, task_prompt: str) -> str:
-        """
-        Bearbetar en uppgift med den interna LangChain AgentExecutor.
-        """
-        print(f"\nBearbetar uppgift med LangChain AgentExecutor: '{task_prompt}'")
-        try:
-            # Anropa agenten med invoke. Den returnerar ett dictionary.
-            # "input" är användarens prompt.
-            # "chat_history" kan skickas in om du har kontext från tidigare konversationer.
-            result = self.agent_executor.invoke({"input": task_prompt})
-            # Det slutgiltiga svaret finns vanligtvis under nyckeln "output"
-            final_answer = result.get("output", "Agenten kunde inte generera ett slutgiltigt svar.")
-            print(f"\nLangChain AgentExecutor avslutad. Slutgiltigt svar: {final_answer}")
-            return final_answer
-        except Exception as e:
-            error_message = f"Ett fel uppstod under agentens bearbetning: {e}"
-            print(error_message)
-            return f"Agenten kunde inte slutföra uppgiften på grund av ett fel: {error_message}"

+"""LangGraph Agent"""
 import os
+from dotenv import load_dotenv
+from langgraph.graph import START, StateGraph, MessagesState
+from langgraph.prebuilt import tools_condition
+from langgraph.prebuilt import ToolNode
+from langchain_google_genai import ChatGoogleGenerativeAI
+from langchain_groq import ChatGroq
+from langchain_huggingface import ChatHuggingFace, HuggingFaceEndpoint, HuggingFaceEmbeddings
+from langchain_community.tools.tavily_search import TavilySearchResults
+from langchain_community.document_loaders import WikipediaLoader
+from langchain_community.document_loaders import ArxivLoader
+from langchain_community.vectorstores import SupabaseVectorStore
+from langchain_core.messages import SystemMessage, HumanMessage
+from langchain_core.tools import tool
+from langchain.tools.retriever import create_retriever_tool
+from supabase.client import Client, create_client
+load_dotenv()
+@tool
+def multiply(a: int, b: int) -> int:
+    """Multiply two numbers.
+    Args:
+        a: first int
+        b: second int
+    """
+    return a * b
+@tool
+def add(a: int, b: int) -> int:
+    """Add two numbers.
+    Args:
+        a: first int
+        b: second int
+    """
+    return a + b
+@tool
+def subtract(a: int, b: int) -> int:
+    """Subtract two numbers.
+    Args:
+        a: first int
+        b: second int
+    """
+    return a - b
+@tool
+def divide(a: int, b: int) -> int:
+    """Divide two numbers.
+    Args:
+        a: first int
+        b: second int
+    """
+    if b == 0:
+        raise ValueError("Cannot divide by zero.")
+    return a / b
+@tool
+def modulus(a: int, b: int) -> int:
+    """Get the modulus of two numbers.
+    Args:
+        a: first int
+        b: second int
+    """
+    return a % b
+@tool
+def wiki_search(query: str) -> str:
+    """Search Wikipedia for a query and return maximum 2 results.
+    Args:
+        query: The search query."""
+    search_docs = WikipediaLoader(query=query, load_max_docs=2).load()
+    formatted_search_docs = "\n\n---\n\n".join(
+        [
+            f'<Document source="{doc.metadata["source"]}" page="{doc.metadata.get("page", "")}"/>\n{doc.page_content}\n</Document>'
+            for doc in search_docs
+        ])
+    return {"wiki_results": formatted_search_docs}
+@tool
+def web_search(query: str) -> str:
+    """Search Tavily for a query and return maximum 3 results.
+    Args:
+        query: The search query."""
+    search_docs = TavilySearchResults(max_results=3).invoke(query=query)
+    formatted_search_docs = "\n\n---\n\n".join(
+        [
+            f'<Document source="{doc.metadata["source"]}" page="{doc.metadata.get("page", "")}"/>\n{doc.page_content}\n</Document>'
+            for doc in search_docs
+        ])
+    return {"web_results": formatted_search_docs}
+@tool
+def arvix_search(query: str) -> str:
+    """Search Arxiv for a query and return maximum 3 result.
+    Args:
+        query: The search query."""
+    search_docs = ArxivLoader(query=query, load_max_docs=3).load()
+    formatted_search_docs = "\n\n---\n\n".join(
+        [
+            f'<Document source="{doc.metadata["source"]}" page="{doc.metadata.get("page", "")}"/>\n{doc.page_content[:1000]}\n</Document>'
+            for doc in search_docs
+        ])
+    return {"arvix_results": formatted_search_docs}
+# load the system prompt from the file
+with open("system_prompt.txt", "r", encoding="utf-8") as f:
+    system_prompt = f.read()
+# System message
+sys_msg = SystemMessage(content=system_prompt)
+# build a retriever
+embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2") #  dim=768
+supabase: Client = create_client(
+    os.environ.get("SUPABASE_URL"),
+    os.environ.get("SUPABASE_SERVICE_KEY"))
+vector_store = SupabaseVectorStore(
+    client=supabase,
+    embedding= embeddings,
+    table_name="documents",
+    query_name="match_documents_langchain",
+)
+create_retriever_tool = create_retriever_tool(
+    retriever=vector_store.as_retriever(),
+    name="Question Search",
+    description="A tool to retrieve similar questions from a vector store.",
+)
+tools = [
+    multiply,
+    add,
+    subtract,
+    divide,
+    modulus,
+    wiki_search,
+    web_search,
+    arvix_search,
+]
+# Build graph function
+def build_graph(provider: str = "google"):
+    """Build the graph"""
+    # Load environment variables from .env file
+    if provider == "google":
+        # Google Gemini
+        llm = ChatGoogleGenerativeAI(model="gemini-2.0-flash", temperature=0)
+    elif provider == "groq":
+        # Groq https://console.groq.com/docs/models
+        llm = ChatGroq(model="qwen-qwq-32b", temperature=0) # optional : qwen-qwq-32b gemma2-9b-it
+    elif provider == "huggingface":
+        # TODO: Add huggingface endpoint
+        llm = ChatHuggingFace(
+            llm=HuggingFaceEndpoint(
+                url="https://api-inference.huggingface.co/models/Meta-DeepLearning/llama-2-7b-chat-hf",
+                temperature=0,
             ),
         )
+    else:
+        raise ValueError("Invalid provider. Choose 'google', 'groq' or 'huggingface'.")
+    # Bind tools to LLM
+    llm_with_tools = llm.bind_tools(tools)
+    # Node
+    def assistant(state: MessagesState):
+        """Assistant node"""
+        return {"messages": [llm_with_tools.invoke(state["messages"])]}
+    # def retriever(state: MessagesState):
+      #  """Retriever node"""
+       # similar_question = vector_store.similarity_search(state["messages"][0].content)
+        #example_msg = HumanMessage(
+         #   content=f"Here I provide a similar question and answer for reference: \n\n{similar_question[0].page_content}",
+       # )
+       # return {"messages": [sys_msg] + state["messages"] + [example_msg]}
+    from langchain_core.messages import AIMessage
+    def retriever(state: MessagesState):
+        query = state["messages"][-1].content
+        similar_doc = vector_store.similarity_search(query, k=1)[0]
+        content = similar_doc.page_content
+        if "Final answer :" in content:
+            answer = content.split("Final answer :")[-1].strip()
+        else:
+            answer = content.strip()
+        return {"messages": [AIMessage(content=answer)]}
+    # builder = StateGraph(MessagesState)
+    #builder.add_node("retriever", retriever)
+    #builder.add_node("assistant", assistant)
+    #builder.add_node("tools", ToolNode(tools))
+    #builder.add_edge(START, "retriever")
+    #builder.add_edge("retriever", "assistant")
+    #builder.add_conditional_edges(
+     #   "assistant",
+      #  tools_condition,
+    #)
+    #builder.add_edge("tools", "assistant")
+    builder = StateGraph(MessagesState)
+    builder.add_node("retriever", retriever)
+    # Retriever ist Start und Endpunkt
+    builder.set_entry_point("retriever")
+    builder.set_finish_point("retriever")
+    # Compile graph
+    return builder.compile()