Spaces:

k3ybladewielder
/

cloudwalk_swarm

Sleeping

App Files Files Community

cloudwalk_swarm / app.py

k3ybladewielder

Update app.py

07de6da verified 8 days ago

raw

history blame contribute delete

13 kB

	# libs
	from huggingface_hub import hf_hub_download
	from langchain.agents import initialize_agent, Tool, AgentType
	from langchain.chains import RetrievalQA, LLMChain
	from langchain_community.llms import HuggingFaceHub
	from langchain.prompts import PromptTemplate
	from langchain_community.vectorstores import FAISS
	from langchain_community.utilities import SerpAPIWrapper
	from langchain_huggingface import HuggingFacePipeline, HuggingFaceEmbeddings
	from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, BitsAndBytesConfig, AutoModelForImageTextToText
	import logging
	import os
	import torch
	import yaml
	import traceback

	# ----------- SETUP -----------
	import warnings
	from dotenv import load_dotenv
	from langchain_text_splitters import CharacterTextSplitter
	from functions import fn_rebuild_vector_store

	logging.getLogger("langchain.text_splitter").setLevel(logging.ERROR)
	warnings.filterwarnings("ignore")
	logging.basicConfig(format="%(asctime)s \| %(levelname)s \| %(message)s", level=logging.INFO)
	logger = logging.getLogger(__name__)

	load_dotenv()

	HF_TOKEN = os.getenv("HF_TOKEN")
	SERPAPI_API_KEY = os.getenv("SERPAPI_API_KEY")

	with open('./config.yaml', 'r', encoding='utf-8') as file:
	config = yaml.safe_load(file)

	EMBEDDING_MODEL = config.get('EMBEDDING_MODEL')
	LLM_MODEL = config.get('LLM_MODEL')
	LLM_MODEL_GGUF = config.get('LLM_MODEL_GGUF')
	LLM_MODEL_FILE = config.get('LLM_MODEL_FILE')

	REBUILD_VECTOR_STORE= config.get('REBUILD_VECTOR_STORE', False)
	CHUNK_SIZE = config.get('CHUNK_SIZE', 500)
	CHUNK_OVERLAP = config.get('CHUNK_OVERLAP', 50)
	CACHE_FOLDER = config.get('CACHE_FOLDER', './cache')
	URL_LIST = config.get('URL_LIST', [])
	VS_BASE = config.get('VS_BASE', './vs')


	# ----------- VECTOR STORE CREATION -----------
	# executando fn para veirficacao True/False de criação de vector store
	fn_rebuild_vector_store(REBUILD_VECTOR_STORE, URL_LIST, VS_BASE, EMBEDDING_MODEL, CACHE_FOLDER, CHUNK_SIZE, CHUNK_OVERLAP)

	# ----------- SWARM -----------

	quantization_config = BitsAndBytesConfig(
	load_in_4bit=True,
	bnb_4bit_quant_type="nf4",
	bnb_4bit_compute_dtype=torch.bfloat16,
	llm_int8_threshold=6.0, # Adicionado para compatibilidade
	llm_int8_skip_modules=None, # Adicionado para compatibilidade
	llm_int8_enable_fp32_cpu_offload=False # Adicionado para compatibilidade
	)


	def get_llm():
	logger.info(f"Carregando modelo do HuggingFace: {LLM_MODEL}")

	tokenizer = AutoTokenizer.from_pretrained(
	LLM_MODEL,
	cache_dir=CACHE_FOLDER)

	model = AutoModelForCausalLM.from_pretrained(
	LLM_MODEL,
	cache_dir=CACHE_FOLDER,
	device_map="auto",
	torch_dtype=torch.float16
	)

	text_pipeline = pipeline(
	"text-generation",
	model=model,
	tokenizer=tokenizer,
	max_new_tokens=250,
	temperature=0.6,
	#eos_token_id=tokenizer.eos_token_id,
	eos_token_id=tokenizer.convert_tokens_to_ids("</s>"),
	return_full_text=False,
	)

	return HuggingFacePipeline(pipeline=text_pipeline)


	def get_embedding_model():
	return HuggingFaceEmbeddings(model_name=EMBEDDING_MODEL, cache_folder=CACHE_FOLDER)

	def load_vector_store():
	logger.info("Loading FAISS vector store...")
	embedding_model = get_embedding_model()
	faiss_file = os.path.join(VS_BASE, "index.faiss")
	pkl_file = os.path.join(VS_BASE, "index.pkl")
	if not os.path.exists(faiss_file) or not os.path.exists(pkl_file):
	raise FileNotFoundError(f"Arquivos .faiss e .pkl não encontrados em {VS_BASE}")
	return FAISS.load_local(VS_BASE, embedding_model, allow_dangerous_deserialization=True)

	def build_specialist_agents(vectorstore, llm):

	template_base = (
	"Você é um especialista da InfinityPay. Use o contexto abaixo para responder à pergunta de forma clara e direta.\n\n"
	"Contexto: {context}\n\nPergunta: {question}\n\nResposta:")

	prompt_template = PromptTemplate(template=template_base, input_variables=["context", "question"])

	def make_agent():
	return RetrievalQA.from_chain_type(
	llm=llm,
	retriever=vectorstore.as_retriever(),
	chain_type_kwargs={"prompt": prompt_template}
	)

	return {
	"GENERIC": Tool(name="GENERIC", func=make_agent().run, description="Agente genérico sobre a InfinityPay."),
	"MAQUININHA": Tool(name="MAQUININHA", func=make_agent().run, description="Especialista em maquininhas."),
	"COBRANCA_ONLINE": Tool(name="COBRANCA_ONLINE", func=make_agent().run, description="Especialista em cobranças online."),
	"PDV_ECOMMERCE": Tool(name="PDV_ECOMMERCE", func=make_agent().run, description="Especialista em PDV e ecommerce."),
	"CONTA_DIGITAL": Tool(name="CONTA_DIGITAL", func=make_agent().run, description="Especialista em conta digital, Pix, boleto, cartão, etc.")
	}

	def load_react_agent(llm):
	if not SERPAPI_API_KEY or SERPAPI_API_KEY == "sua_serpapi_key":
	return None
	try:
	react_tool = Tool(
	name="WebSearch",
	func=SerpAPIWrapper(serpapi_api_key=SERPAPI_API_KEY).run,
	description="Busca na web."
	)
	return initialize_agent(
	tools=[react_tool],
	llm=llm,
	agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
	verbose=False,
	handle_parsing_errors=True
	)
	except Exception as e:
	logger.error(f"Erro no ReAct: {e}")
	return None

	def fallback_fn(input_text: str, llm) -> str:
	prompt_text = (
	"A seguinte pergunta do usuário não pode ser direcionada para um agente específico.\n"
	"Responda de forma geral e amigável, informando que a equipe de suporte pode ajudar.\n"
	f"\n\nPergunta: {input_text}"
	)
	try:
	response = llm.invoke(prompt_text)
	clean_response = response.strip().split("<eos>")[0].strip()
	return clean_response.replace("[Assistant]:", "").strip()
	except Exception as e:
	return "Desculpe, não consegui processar sua solicitação agora."

	def build_router_chain(llm, tokenizer):
	return None # Roteador baseado em palavras-chave substitui LLMChain

	def keyword_router(input_text: str) -> str:
	keywords_map = {
	"MAQUININHA": ["maquininha", "máquina", "POS", "pagamento físico"],
	"COBRANCA_ONLINE": ["link de pagamento", "cobrança online", "pagamento online", "checkout"],
	"PDV_ECOMMERCE": ["PDV", "ecommerce", "venda online", "loja virtual"],
	"CONTA_DIGITAL": ["conta digital", "pix", "boleto", "transferência", "cartão"]
	}
	input_lower = input_text.lower()
	for agent, keywords in keywords_map.items():
	if any(keyword.lower() in input_lower for keyword in keywords):
	return agent
	return "GENERIC"

	def keyword_router(input_text: str) -> str:
	keywords_map = {
	"MAQUININHA": ["maquininha", "máquina", "POS", "pagamento físico", "taxa", "%"],
	"COBRANCA_ONLINE": ["pagamento", "link de pagamento", "cobrança online", "pagamento online", "checkout"],
	"PDV_ECOMMERCE": ["PDV", "ecommerce", "venda online", "loja virtual"],
	"CONTA_DIGITAL": ["conta digital", "pix", "boleto", "transferência", "cartão"]
	}
	input_lower = input_text.lower()
	for agent, keywords in keywords_map.items():
	if any(keyword in input_lower for keyword in keywords):
	return agent
	return "GENERIC" # ou "Fallback" se quiser forçar atendimento humano


	# def swarm_router(input_text: str, tools: dict, router_chain, llm) -> str:
	# try:
	# agent_name = keyword_router(input_text)
	# selected_tool = tools.get(agent_name, tools["Fallback"])
	# if agent_name == "Fallback":
	# return selected_tool.func(input_text, llm)
	# elif selected_tool.func:
	# return selected_tool.run(input_text)
	# else:
	# return fallback_fn(input_text, llm)
	# except Exception as e:
	# return fallback_fn(input_text, llm)

	def swarm_router(input_text: str, tools: dict, router_chain, llm) -> str:
	try:
	agent_name = keyword_router(input_text)
	selected_tool = tools.get(agent_name)

	if selected_tool and selected_tool.func:
	return selected_tool.run(input_text)
	else:
	return fallback_fn(input_text, llm)

	except Exception as e:
	return fallback_fn(input_text, llm)

	import gradio as gr

	# Variáveis globais para reuso no Gradio
	llm = None
	tokenizer = None
	tools = None
	router_chain = None

	def setup():
	global llm, tokenizer, tools, router_chain

	logger.info("Inicializando Swarm via Gradio...")

	try:
	llm = get_llm()
	tokenizer = llm.pipeline.tokenizer
	except Exception as e:
	logger.error("Erro ao carregar LLM.")
	print(traceback.print_exc())
	return "Erro ao carregar o modelo."

	try:
	vectorstore = load_vector_store()
	except Exception as e:
	logger.error("Erro ao carregar vectorstore.")
	print(traceback.print_exc())
	vectorstore = None

	specialists = build_specialist_agents(vectorstore, llm) if vectorstore else {}
	react_agent = load_react_agent(llm)
	router_chain = build_router_chain(llm, tokenizer)

	tools_local = {}
	tools_local.update(specialists)
	if react_agent:
	tools_local["ReAct"] = Tool(name="ReAct", func=react_agent.run, description="Busca externa na web.")
	tools_local["Fallback"] = Tool(name="Fallback", func=lambda x: fallback_fn(x, llm), description="Fallback generalista.")

	tools = tools_local

	# def gradio_response(user_input):
	# if not tools:
	# return "Agentes ainda não estão prontos. Aguarde o carregamento."
	# return swarm_router(user_input, tools, router_chain, llm)

	# Inicializa o sistema
	setup()

	# Interface Gradio
	#gr.ChatInterface(
	# fn=gradio_response,
	# inputs=gr.Textbox(label="Sua pergunta", placeholder="Digite sua dúvida aqui..."),
	# outputs=gr.Textbox(label="Resposta do Swarm"),
	# title="Assistente InfinityPay",
	# description="Digite uma pergunta relacionada à InfinityPay e receba uma resposta especializada.",
	# theme="default",
	# examples=[
	# ["Quais são as soluções da InfinitePay para o meu negócio?"],
	# ["Como começar a vender com a InfinitePay?"],
	# ["Pessoa Física pode vender com a InfinitePay?"],
	# ["Como faço o meu cadastro na InfinitePay?"],
	# ["Qual é o prazo de entrega da Maquininha Smart?"],
	# ["Quais são as taxas da InfinitePay para CNPJ?"],
	# ["Quais são as taxas da InfinitePay para CPF?"],
	# ["Quais são as taxas da InfinitePay?"],
	# ["Quais bandeiras são aceitas para adquirir as soluções da InfinitePay?"],
	# ["Como posso comprar uma Maquininha Smart?"],
	# ["Quais modelos de máquinas de cartão posso comprar?"],
	# ["Posso ter mais de uma máquina no mesmo CNPJ?"],
	# ["Em quanto tempo é feita a análise do meu cadastro?"],
	# ["Pago aluguel para usar InfinitePay?"],

	# ]
	# ).launch(share=True)

	# --- 8. Criação da Interface Gradio ---

	def gradio_response(user_input, history):
	if not tools:
	return "Agentes ainda não estão prontos. Aguarde o carregamento."
	return swarm_router(user_input, tools, router_chain, llm)

	if __name__ == "__main__":
	print("Iniciando a interface Gradio...")
	demo = gr.ChatInterface(
	type="messages",
	fn=gradio_response, # A função que processa a pergunta e retorna a resposta
	title="Assistente InfinityPay",
	description="Digite uma pergunta relacionada à InfinityPay e receba uma resposta especializada.",
	submit_btn="Enviar Pergunta",

	examples=[
	["Quais são as soluções da InfinitePay para o meu negócio?"],
	["Como começar a vender com a InfinitePay?"],
	["Pessoa Física pode vender com a InfinitePay?"],
	["Como faço o meu cadastro na InfinitePay?"],
	["Qual é o prazo de entrega da Maquininha Smart?"],
	["Quais são as taxas da InfinitePay para CNPJ?"],
	["Quais são as taxas da InfinitePay para CPF?"],
	["Quais são as taxas da InfinitePay?"],
	["Quais bandeiras são aceitas para adquirir as soluções da InfinitePay?"],
	["Como posso comprar uma Maquininha Smart?"],
	["Quais modelos de máquinas de cartão posso comprar?"],
	["Posso ter mais de uma máquina no mesmo CNPJ?"],
	["Em quanto tempo é feita a análise do meu cadastro?"],
	["Pago aluguel para usar InfinitePay?"],
	],

	chatbot=gr.Chatbot(type="messages")
	)
	demo.launch()