Spaces:

DHEIVER
/

my-rag-space

Running

App Files Files Community

my-rag-space / app.py

DHEIVER

Update app.py

c31a53d verified 5 months ago

raw

history blame

12.6 kB

	import os
	from typing import Optional, Tuple, Dict
	import gradio as gr
	from langchain_community.document_loaders import PyPDFLoader, DirectoryLoader
	from langchain.text_splitter import RecursiveCharacterTextSplitter
	from langchain_community.embeddings import HuggingFaceEmbeddings
	from langchain_community.vectorstores import FAISS
	from langchain_community.llms import HuggingFacePipeline
	from langchain.chains import RetrievalQA
	from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, pipeline
	import torch
	import tempfile
	import time

	# Configurações
	EMBEDDING_MODEL = "sentence-transformers/all-mpnet-base-v2"
	LLM_MODEL = "google/flan-t5-large"
	DOCS_DIR = "documents"

	class RAGSystem:
	def __init__(self):
	self.tokenizer = AutoTokenizer.from_pretrained(LLM_MODEL)
	self.model = AutoModelForSeq2SeqLM.from_pretrained(
	LLM_MODEL,
	device_map="auto",
	torch_dtype=torch.float32
	)

	pipe = pipeline(
	"text2text-generation",
	model=self.model,
	tokenizer=self.tokenizer,
	max_length=512,
	temperature=0.3, # Reduzido para respostas mais precisas
	top_p=0.9, # Ajustado para permitir diversidade controlada
	repetition_penalty=1.2 # Evita repetições
	)

	self.llm = HuggingFacePipeline(pipeline=pipe)
	self.embeddings = HuggingFaceEmbeddings(
	model_name=EMBEDDING_MODEL,
	model_kwargs={'device': 'cpu'}
	)
	self.base_db = self.load_base_knowledge()

	def load_base_knowledge(self) -> Optional[FAISS]:
	try:
	if not os.path.exists(DOCS_DIR):
	os.makedirs(DOCS_DIR)
	return None

	loader = DirectoryLoader(
	DOCS_DIR,
	glob="*/.pdf",
	loader_cls=PyPDFLoader
	)
	documents = loader.load()

	if not documents:
	return None

	text_splitter = RecursiveCharacterTextSplitter(
	chunk_size=500,
	chunk_overlap=100,
	length_function=len,
	separators=["\n\n", "\n", ".", " ", ""]
	)
	texts = text_splitter.split_documents(documents)

	return FAISS.from_documents(texts, self.embeddings)

	except Exception as e:
	print(f"Erro ao carregar base de conhecimento: {str(e)}")
	return None

	def process_pdf(self, file_content: bytes) -> Optional[FAISS]:
	try:
	with tempfile.NamedTemporaryFile(delete=False, suffix='.pdf') as tmp_file:
	tmp_file.write(file_content)
	tmp_path = tmp_file.name

	loader = PyPDFLoader(tmp_path)
	documents = loader.load()
	os.unlink(tmp_path)

	if not documents:
	return None

	text_splitter = RecursiveCharacterTextSplitter(
	chunk_size=500,
	chunk_overlap=100,
	length_function=len,
	separators=["\n\n", "\n", ".", " ", ""]
	)
	texts = text_splitter.split_documents(documents)

	db = FAISS.from_documents(texts, self.embeddings)

	if self.base_db is not None:
	db.merge_from(self.base_db)

	return db

	except Exception as e:
	print(f"Erro ao processar PDF: {str(e)}")
	return None

	def format_response(self, raw_response: str, source_type: str, context_found: bool) -> str:
	"""Formata a resposta para um formato padronizado e claro"""
	if not context_found:
	return "🔍 Não foram encontradas informações suficientes nos documentos para responder esta pergunta."

	prefix = ""
	if source_type == "pdf":
	prefix = "📄 [Resposta baseada no PDF enviado]\n\n"
	elif source_type == "base":
	prefix = "📚 [Resposta baseada na base de documentos]\n\n"
	elif source_type == "both":
	prefix = "📚📄 [Resposta baseada em ambas as fontes]\n\n"

	# Limpa e formata a resposta
	response = raw_response.strip()
	if not response:
	return "🔍 Não foi possível gerar uma resposta adequada com as informações disponíveis."

	return f"{prefix}{response}"

	def generate_response(self, file_obj, query: str, progress=gr.Progress()) -> Tuple[str, str, str]:
	"""Retorna (resposta, status, tempo_decorrido)"""
	if not query.strip():
	return "Por favor, insira uma pergunta.", "⚠️ Aguardando pergunta", "0s"

	start_time = time.time()
	try:
	progress(0.2, desc="Processando documentos...")

	# Determina a fonte dos documentos
	has_pdf = file_obj is not None
	has_base = self.base_db is not None
	source_type = "both" if has_pdf and has_base else "pdf" if has_pdf else "base" if has_base else None

	if not source_type:
	return "Nenhuma fonte de documentos disponível.", "❌ Sem documentos", "0s"

	# Processa documento
	if has_pdf:
	db = self.process_pdf(file_obj)
	if db is None:
	return "Não foi possível processar o PDF.", "❌ Erro no processamento", "0s"
	else:
	db = self.base_db

	progress(0.4, desc="Buscando informações relevantes...")

	# Configuração do RAG
	qa_chain = RetrievalQA.from_chain_type(
	llm=self.llm,
	chain_type="stuff",
	retriever=db.as_retriever(
	search_kwargs={
	"k": 4,
	"fetch_k": 6,
	"score_threshold": 0.6 # Filtra resultados pouco relevantes
	}
	),
	return_source_documents=True
	)

	progress(0.6, desc="Gerando resposta...")

	# Prompt mais estruturado
	prompt = f"""Instruções:
	1. Analise cuidadosamente os documentos fornecidos.
	2. Responda à seguinte pergunta em português de forma clara e direta: {query}
	3. Use apenas informações encontradas nos documentos.
	4. Se não houver informações suficientes, indique explicitamente.
	5. Mantenha a resposta objetiva e baseada em fatos.
	6. Cite exemplos específicos dos documentos quando relevante.
	7. Evite inventar informações que não estão presentes nos documentos.

	Pergunta: {query}"""

	# Gera resposta
	result = qa_chain({"query": prompt})

	# Verifica se encontrou contexto relevante
	context_found = bool(result.get("source_documents", []))

	# Formata a resposta
	formatted_response = self.format_response(
	result["result"],
	source_type,
	context_found
	)

	elapsed_time = f"{time.time() - start_time:.1f}s"
	progress(1.0, desc="Concluído!")

	return formatted_response, "✅ Sucesso", elapsed_time

	except Exception as e:
	elapsed_time = f"{time.time() - start_time:.1f}s"
	return f"Erro ao gerar resposta: {str(e)}", "❌ Erro", elapsed_time

	def create_demo():
	rag = RAGSystem()

	with gr.Blocks(theme=gr.themes.Soft()) as demo:
	with gr.Column(elem_id="container"):
	# Cabeçalho
	gr.Markdown(
	"""
	# 🤖 Assistente de Documentos Inteligente

	Sistema de consulta avançada que responde perguntas sobre seus documentos usando RAG.
	"""
	)

	# Área principal
	with gr.Row():
	# Coluna de entrada
	with gr.Column():
	with gr.Group():
	gr.Markdown("### 📄 Documentos")
	file_input = gr.File(
	label="Upload de PDF (opcional)",
	type="binary",
	file_types=[".pdf"],
	height=100,
	)
	info = gr.Markdown(
	f"""
	ℹ️ O sistema consulta:
	- PDFs enviados por você
	- Documentos na pasta `{DOCS_DIR}`
	"""
	)

	with gr.Group():
	gr.Markdown("### ❓ Sua Pergunta")
	query_input = gr.Textbox(
	placeholder="Digite sua pergunta sobre os documentos...",
	lines=3,
	max_lines=6,
	show_label=False,
	)

	with gr.Row():
	clear_btn = gr.Button("🗑️ Limpar", variant="secondary")
	submit_btn = gr.Button("🔍 Enviar Pergunta", variant="primary")

	# Coluna de saída
	with gr.Column():
	with gr.Group():
	gr.Markdown("### 📝 Resposta")
	with gr.Row():
	status_output = gr.Textbox(
	label="Status",
	value="⏳ Aguardando...",
	interactive=False,
	show_label=False,
	)
	time_output = gr.Textbox(
	label="Tempo",
	value="0s",
	interactive=False,
	show_label=False,
	)

	response_output = gr.Textbox(
	label="Resposta",
	placeholder="A resposta aparecerá aqui...",
	interactive=False,
	lines=12,
	show_label=False,
	)

	# Exemplos
	with gr.Accordion("📚 Exemplos de Perguntas", open=False):
	gr.Examples(
	examples=[
	[None, "Quais são os principais tópicos abordados neste documento?"],
	[None, "Resuma as conclusões mais importantes."],
	[None, "O que o documento diz sobre [tema específico]?"],
	[None, "Quais são as recomendações apresentadas?"],
	],
	inputs=[file_input, query_input],
	)

	# Rodapé
	gr.Markdown(
	"""
	---
	### 🔧 Informações do Sistema
	* Respostas geradas usando tecnologia RAG (Retrieval-Augmented Generation)
	* Processamento inteligente de documentos PDF
	* Respostas baseadas exclusivamente no conteúdo dos documentos
	* Suporte a múltiplos documentos e contextos
	"""
	)

	# Eventos
	submit_btn.click(
	fn=rag.generate_response,
	inputs=[file_input, query_input],
	outputs=[response_output, status_output, time_output],
	)

	clear_btn.click(
	lambda: (None, "", "⏳ Aguardando...", "0s"),
	outputs=[file_input, query_input, status_output, time_output],
	)

	# Limpa a resposta quando a pergunta muda
	query_input.change(
	lambda: ("", "⏳ Aguardando...", "0s"),
	outputs=[response_output, status_output, time_output],
	)

	return demo

	if __name__ == "__main__":
	demo = create_demo()
	demo.launch()