import os import torch from huggingface_hub import InferenceClient # Importera LangChain-komponenter from langchain_community.llms import HuggingFaceHub # För att använda HF Inference API som LLM from langchain.agents import AgentExecutor, create_react_agent # Agentens exekverare och ReAct-agent konstruktorn from langchain.tools import Tool # Verktygsklassen i LangChain from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder from langchain_core.messages import HumanMessage, AIMessage # Importera dina befintliga, anpassade verktygsfunktioner from tavily_search import search_tavily from asr_tool import transcribe_audio from excel_tool import analyze_excel from math_tool import calculate_math class GaiaAgent: def __init__(self, model_id: str = "google/gemma-2b-it"): """ Initialiserar GaiaAgent, nu med LangChain. """ print(f"Initialiserar GaiaAgent med modell: {model_id}") hf_token = os.getenv("HF_TOKEN") or os.getenv("HUGGING_FACE_HUB_TOKEN") if not hf_token: raise ValueError( "Hugging Face token (HF_TOKEN eller HUGGING_FACE_HUB_TOKEN) är inte konfigurerad i miljövariabler." "Vänligen lägg till din token som en 'Repository secret' i dina Space-inställningar." ) # 1. Initialisera LLM med LangChain's HuggingFaceHub try: # HuggingFaceHub ansluter till en fjärrmodell via HF Inference API self.llm = HuggingFaceHub( repo_id=model_id, huggingfacehub_api_token=hf_token, task="text-generation", # Specifiera task # model_kwargs={"temperature": 0.1, "max_new_tokens": 512} # Exempel på modell-kwargs ) print("LangChain HuggingFaceHub LLM laddad framgångsrikt.") except Exception as e: raise RuntimeError( f"Misslyckades att initialisera HuggingFaceHub LLM: {e}." "Vänligen kontrollera din HF token och att modellen är tillgänglig/laddningsbar." ) # 2. Definiera dina anpassade verktyg som LangChain Tool-objekt tools_list = [ Tool.from_function( func=search_tavily, name="search_tavily", description="Användbart för att söka information online med Tavily Search. Returnerar en sammanfattning av de mest relevanta resultaten från webben. Kräver en fråga som input.", ), Tool.from_function( func=transcribe_audio, name="transcribe_audio", description="Transkriberar ljudfil till text. Användbart för att omvandla tal till text från en angiven ljudfilsväg. Kräver en filsökväg till ljudfilen som input.", ), Tool.from_function( func=analyze_excel, name="analyze_excel", description="Analysera Excel-filer och returnera detaljerad information om rader, kolumner, datatyper och statistik (summa, medelvärde, max, min för numeriska kolumner). Kan ta både en lokal filväg eller en URL till Excel-filen som input.", ), Tool.from_function( func=calculate_math, name="calculate_math", description="Beräkna matematiska uttryck. Användbart för att utföra aritmetiska operationer som addition, subtraktion, multiplikation, division och potenser. Tar ett matematiskt uttryck som en sträng som input.", ) ] print(f"Laddade {len(tools_list)} anpassade verktyg för LangChain.") # 3. Skapa en prompt för ReAct-agenten # Detta prompt-format är viktigt för hur LLM:en förstår att använda verktyg. # MessagesPlaceholder används för att injicera verktyg och meddelandehistorik dynamiskt. prompt = ChatPromptTemplate.from_messages( [ ("system", "Du är en hjälpsam AI-assistent. Använd tillgängliga verktyg för att svara på frågor."), MessagesPlaceholder("chat_history", optional=True), ("human", "{input}"), MessagesPlaceholder("agent_scratchpad"), # Detta är där agentens tankar och verktygskall kommer att finnas ] ) # 4. Initialisera LangChain ReAct-agenten # create_react_agent är en konstruktorfunktion för en ReAct-baserad agent agent = create_react_agent(self.llm, tools_list, prompt) # 5. Skapa AgentExecutor för att köra agenten # AgentExecutor är den körbara delen som hanterar agentens "tankeloop" och verktygskall self.agent_executor = AgentExecutor( agent=agent, tools=tools_list, verbose=True, # Sätt till True för att se agentens tankeprocess i loggarna handle_parsing_errors=True # Hantera parsningsfel graciöst ) print("LangChain AgentExecutor initialiserad.") def process_task(self, task_prompt: str) -> str: """ Bearbetar en uppgift med den interna LangChain AgentExecutor. """ print(f"\nBearbetar uppgift med LangChain AgentExecutor: '{task_prompt}'") try: # Anropa agenten med invoke. Den returnerar ett dictionary. # "input" är användarens prompt. # "chat_history" kan skickas in om du har kontext från tidigare konversationer. result = self.agent_executor.invoke({"input": task_prompt}) # Det slutgiltiga svaret finns vanligtvis under nyckeln "output" final_answer = result.get("output", "Agenten kunde inte generera ett slutgiltigt svar.") print(f"\nLangChain AgentExecutor avslutad. Slutgiltigt svar: {final_answer}") return final_answer except Exception as e: error_message = f"Ett fel uppstod under agentens bearbetning: {e}" print(error_message) return f"Agenten kunde inte slutföra uppgiften på grund av ett fel: {error_message}"