Spaces:

baderanas
/

rag-medical

Running

rag-medical / rag.py

Update rag.py

bc957c6 verified 23 days ago

1.08 kB

	from typing import List, Optional
	from llms import initialize_llms, answer_query_with_chunks, query_to_retrieve
	from chroma_operations.retrieve import search_similar_chunks
	import asyncio

	# Load LLM once at startup
	llms = initialize_llms()
	llm = llms["llm"]

	def ask_question(
	query_text: str,
	file_names: List[str],
	collection_name: str = "rag_collection"
	) -> dict:
	try:
	# Await async LLM calls
	query_search = query_to_retrieve(query_text, llm)

	# Await ChromaDB search
	retrieved_docs = search_similar_chunks(
	query_search,
	document_names=file_names,
	collection_name=collection_name,
	)

	if not retrieved_docs:
	return {"answer": "No matching documents found.", "chunks": []}

	# Await answer generation
	answer = answer_query_with_chunks(query_text, retrieved_docs, llm)
	return {"answer": answer, "chunks": retrieved_docs}

	except Exception as e:
	return {"answer": f"Error processing request: {str(e)}", "chunks": []}