Spaces:

bainskarman
/

AllAboutRAG

Sleeping

App Files Files Community

bainskarman commited on Mar 13

Commit

28202fc

verified ·

1 Parent(s): 783a14e

Update app.py

Browse files

Files changed (1) hide show

app.py +81 -108

app.py CHANGED Viewed

@@ -8,34 +8,25 @@ from sentence_transformers import SentenceTransformer
 from langdetect import detect
 # Load the Hugging Face token
-huggingface_token = os.environ.get("Key2")
 # Load Sentence Transformer Model
-embedder = SentenceTransformer("all-MiniLM-L6-v2")
-# Default system prompts for each query translation method
-DEFAULT_SYSTEM_PROMPTS = {
-    "Multi-Query": """You are an AI language model assistant. Your task is to generate five \
-different versions of the given user question to retrieve relevant documents from a vector \
-database. By generating multiple perspectives on the user question, your goal is to help\
-the user overcome some of the limitations of the distance-based similarity search.\
-Provide these alternative questions separated by newlines. Original question: {question}""",
-    "RAG Fusion": """You are an AI language model assistant. Your task is to combine multiple \
-queries into a single, refined query to improve retrieval accuracy. Original question: {question}""",
-    "Decomposition": """You are an AI language model assistant. Your task is to break down \
-the given user question into simpler sub-questions. Provide these sub-questions separated \
-by newlines. Original question: {question}""",
-    "Step Back": """You are an AI language model assistant. Your task is to refine the given \
-user question by taking a step back and asking a more general question. Original question: {question}""",
-    "HyDE": """You are an AI language model assistant. Your task is to generate a hypothetical \
-document that would be relevant to the given user question. Original question: {question}""",
 }
-# Function to query the Hugging Face model
-def query_huggingface_model(prompt, max_new_tokens=1000, temperature=0.7, top_k=50):
-    model_name = "HuggingFaceH4/zephyr-7b-alpha"
-    api_url = f"https://api-inference.huggingface.co/models/{model_name}"
-    headers = {"Authorization": f"Bearer {huggingface_token}"}
     payload = {
         "inputs": prompt,
         "parameters": {
@@ -44,63 +35,77 @@ def query_huggingface_model(prompt, max_new_tokens=1000, temperature=0.7, top_k=
             "top_k": top_k,
         },
     }
-    response = requests.post(api_url, headers=headers, json=payload)
     if response.status_code == 200:
         return response.json()[0]["generated_text"]
-    else:
-        st.error(f"Error: {response.status_code} - {response.text}")
-        return None
-# Function to detect language
-def detect_language(text):
-    try:
-        return detect(text)
-    except:
-        return "en"
-# Extract text from PDF with line and page numbers
-def extract_text_from_pdf(pdf_file):
-    text = extract_text(pdf_file)
-    return text.split("\n")
-# Chunk text into smaller segments
-def split_text_into_chunks(text_lines, chunk_size=500):
     words = " ".join(text_lines).split()
     return [" ".join(words[i:i + chunk_size]) for i in range(0, len(words), chunk_size)]
 # Build FAISS Index
-def build_faiss_index(embeddings):
     dimension = embeddings.shape[1]
     index = faiss.IndexFlatL2(dimension)
     index.add(embeddings)
     return index
-# Search in FAISS Index
-def search_faiss_index(query_embedding, index, top_k=5):
     distances, indices = index.search(query_embedding, top_k)
-    return indices[0], distances[0]
-def main():
-    st.title("Enhanced RAG Model with FAISS Indexing")
-    # Sidebar for options
-    st.sidebar.header("Upload PDF")
-    pdf_file = st.sidebar.file_uploader("Upload a PDF file", type="pdf")
-    st.sidebar.header("Query Translation")
-    query_translation = st.sidebar.selectbox(
-        "Select Query Translation Method",
-        ["Multi-Query", "RAG Fusion", "Decomposition", "Step Back", "HyDE"]
-    )
-    st.sidebar.header("Similarity Search")
-    similarity_method = st.sidebar.selectbox("Select Similarity Search Method", ["Cosine Similarity", "KNN"])
-    if similarity_method == "KNN":
-        k_value = st.sidebar.slider("Select K Value", 1, 10, 5)
-    # LLM Parameters
     max_new_tokens = st.sidebar.slider("Max New Tokens", 10, 1000, 500)
     temperature = st.sidebar.slider("Temperature", 0.1, 1.0, 0.7)
     top_k = st.sidebar.slider("Top K", 1, 100, 50)
@@ -108,66 +113,34 @@ def main():
     # Input Prompt
     prompt = st.text_input("Enter your query:")
-    # State to hold intermediate results
-    if 'embeddings' not in st.session_state:
-        st.session_state.embeddings = None
     if 'chunks' not in st.session_state:
         st.session_state.chunks = []
     if 'faiss_index' not in st.session_state:
         st.session_state.faiss_index = None
-    if 'relevant_chunks' not in st.session_state:
-        st.session_state.relevant_chunks = []
-    if 'translated_queries' not in st.session_state:
-        st.session_state.translated_queries = []
-    # Button 1: Embed PDF
     if st.button("1. Embed PDF") and pdf_file:
-        text_lines = extract_text_from_pdf(pdf_file)
-        st.session_state.lang = detect_language(" ".join(text_lines))
-        st.write(f"**Detected Language:** {st.session_state.lang}")
-        # Chunk the text
-        st.session_state.chunks = split_text_into_chunks(text_lines)
-        # Encode chunks
-        chunk_embeddings = embedder.encode(st.session_state.chunks, convert_to_tensor=False)
-        # Build FAISS index
-        st.session_state.faiss_index = build_faiss_index(np.array(chunk_embeddings))
         st.success("PDF Embedded Successfully")
-    # Button 2: Generate Translated Queries
     if st.button("2. Query Translation") and prompt:
-        formatted_prompt = DEFAULT_SYSTEM_PROMPTS[query_translation].format(question=prompt)
-        response = query_huggingface_model(formatted_prompt, max_new_tokens, temperature, top_k)
-        st.session_state.translated_queries = response.split("\n")
-        st.write("**Generated Queries:**")
-        st.write(st.session_state.translated_queries)
-    # Button 3: Retrieve Document Details
     if st.button("3. Retrieve Documents") and st.session_state.translated_queries:
-        st.session_state.relevant_chunks = []
-        for query in st.session_state.translated_queries:
-            query_embedding = embedder.encode([query], convert_to_tensor=False)
-            top_k_indices, _ = search_faiss_index(np.array(query_embedding), st.session_state.faiss_index, top_k=5)
-            relevant_chunks = [st.session_state.chunks[i] for i in top_k_indices]
-            st.session_state.relevant_chunks.append(relevant_chunks)
-        st.write("**Retrieved Documents (for each query):**")
-        for i, relevant_chunks in enumerate(st.session_state.relevant_chunks):
-            st.write(f"**Query {i + 1}: {st.session_state.translated_queries[i]}**")
-            for chunk in relevant_chunks:
-                st.write(f"{chunk[:100]}...")
-    # Button 4: Generate Final Response
-    if st.button("4. Final Response") and st.session_state.relevant_chunks:
-        context = "\n".join([chunk for sublist in st.session_state.relevant_chunks for chunk in sublist])
-        llm_input = f"{DEFAULT_SYSTEM_PROMPTS[query_translation].format(question=prompt)}\n\nContext: {context}\n\nAnswer this question: {prompt}"
-        final_response = query_huggingface_model(llm_input, max_new_tokens, temperature, top_k)
         st.subheader("Final Response:")
         st.write(final_response)
 if __name__ == "__main__":
     main()

 from langdetect import detect
 # Load the Hugging Face token
+HUGGINGFACE_TOKEN = os.environ.get("Key2")
+HF_MODEL = "HuggingFaceH4/zephyr-7b-alpha"
 # Load Sentence Transformer Model
+EMBEDDER = SentenceTransformer("all-MiniLM-L6-v2")
+# Default system prompts
+SYSTEM_PROMPTS = {
+    "Multi-Query": "Generate five alternative versions of the user question: {question}",
+    "RAG Fusion": "Combine multiple queries into a single, refined query: {question}",
+    "Decomposition": "Break down the user question into simpler sub-questions: {question}",
+    "Step Back": "Refine the user question by asking a more general question: {question}",
+    "HyDE": "Generate a hypothetical document relevant to the user question: {question}",
 }
+# Helper function to interact with Hugging Face API
+def query_hf(prompt, max_new_tokens=1000, temperature=0.7, top_k=50):
+    headers = {"Authorization": f"Bearer {HUGGINGFACE_TOKEN}"}
     payload = {
         "inputs": prompt,
         "parameters": {
             "top_k": top_k,
         },
     }
+    response = requests.post(f"https://api-inference.huggingface.co/models/{HF_MODEL}", headers=headers, json=payload)
     if response.status_code == 200:
         return response.json()[0]["generated_text"]
+    st.error(f"Error: {response.status_code} - {response.text}")
+# Extract text from PDF
+def extract_pdf_text(pdf_file):
+    return extract_text(pdf_file).split("\n")
+# Chunk text into segments
+def chunk_text(text_lines, chunk_size=500):
     words = " ".join(text_lines).split()
     return [" ".join(words[i:i + chunk_size]) for i in range(0, len(words), chunk_size)]
 # Build FAISS Index
+def build_index(embeddings):
     dimension = embeddings.shape[1]
     index = faiss.IndexFlatL2(dimension)
     index.add(embeddings)
     return index
+# Search FAISS Index
+def search_index(query_embedding, index, top_k=5):
     distances, indices = index.search(query_embedding, top_k)
+    return indices[0]
+# Embed PDF content and build FAISS index
+def process_pdf(pdf_file):
+    text_lines = extract_pdf_text(pdf_file)
+    chunks = chunk_text(text_lines)
+    embeddings = EMBEDDER.encode(chunks, convert_to_tensor=False)
+    faiss_index = build_index(np.array(embeddings))
+    return chunks, faiss_index
+# Generate query translations
+def translate_query(prompt, method, max_new_tokens, temperature, top_k):
+    formatted_prompt = SYSTEM_PROMPTS[method].format(question=prompt)
+    return query_hf(formatted_prompt, max_new_tokens, temperature, top_k).split("\n")
+# Retrieve relevant chunks from FAISS index
+def retrieve_chunks(translated_queries, faiss_index, chunks, top_k=5):
+    relevant_chunks = []
+    for query in translated_queries:
+        query_embedding = EMBEDDER.encode([query], convert_to_tensor=False)
+        indices = search_index(np.array(query_embedding), faiss_index, top_k)
+        relevant_chunks.extend([chunks[i] for i in indices])
+    return relevant_chunks
+# Generate final response using RAG approach
+def generate_final_response(prompt, context, max_new_tokens, temperature, top_k):
+    input_text = f"Context: {context}\n\nAnswer this question: {prompt}"
+    return query_hf(input_text, max_new_tokens, temperature, top_k)
+# Streamlit UI
+def main():
+    st.title("Enhanced RAG Model with FAISS Indexing")
+    # Sidebar Inputs
+    pdf_file = st.sidebar.file_uploader("Upload PDF", type="pdf")
+    query_translation = st.sidebar.selectbox("Query Translation Method", list(SYSTEM_PROMPTS.keys()))
+    similarity_method = st.sidebar.selectbox("Similarity Search Method", ["Cosine Similarity", "KNN"])
+    k_value = st.sidebar.slider("K Value (for KNN)", 1, 10, 5) if similarity_method == "KNN" else 5
     max_new_tokens = st.sidebar.slider("Max New Tokens", 10, 1000, 500)
     temperature = st.sidebar.slider("Temperature", 0.1, 1.0, 0.7)
     top_k = st.sidebar.slider("Top K", 1, 100, 50)
     # Input Prompt
     prompt = st.text_input("Enter your query:")
+    # State Management
     if 'chunks' not in st.session_state:
         st.session_state.chunks = []
     if 'faiss_index' not in st.session_state:
         st.session_state.faiss_index = None
+    # Step 1: Process PDF
     if st.button("1. Embed PDF") and pdf_file:
+        st.session_state.chunks, st.session_state.faiss_index = process_pdf(pdf_file)
         st.success("PDF Embedded Successfully")
+    # Step 2: Generate Translated Queries
     if st.button("2. Query Translation") and prompt:
+        st.session_state.translated_queries = translate_query(prompt, query_translation, max_new_tokens, temperature, top_k)
+        st.write("**Generated Queries:**", st.session_state.translated_queries)
+    # Step 3: Retrieve Relevant Chunks
     if st.button("3. Retrieve Documents") and st.session_state.translated_queries:
+        st.session_state.relevant_chunks = retrieve_chunks(st.session_state.translated_queries, st.session_state.faiss_index, st.session_state.chunks, top_k=k_value)
+        st.write("**Retrieved Chunks:**", st.session_state.relevant_chunks)
+    # Step 4: Generate Final Response
+    if st.button("4. Generate Final Response") and st.session_state.relevant_chunks:
+        context = "\n".join(st.session_state.relevant_chunks)
+        final_response = generate_final_response(prompt, context, max_new_tokens, temperature, top_k)
         st.subheader("Final Response:")
         st.write(final_response)
 if __name__ == "__main__":
     main()