Spaces:

IProject-10
/

Llama-RAG-Chatbot

Sleeping

App Files Files Community

IProject-10 commited on Jul 18

Commit

4fdeec5

verified ·

1 Parent(s): 3eef18c

Update app.py

Browse files

Files changed (1) hide show

app.py +82 -61

app.py CHANGED Viewed

@@ -1,35 +1,55 @@
 import os
-import re
 import logging
 import requests
 import numpy as np
 import faiss
 from bs4 import BeautifulSoup
 from sentence_transformers import SentenceTransformer
 from langchain.embeddings import HuggingFaceEmbeddings
-from langchain_community.vectorstores import FAISS as LangchainFAISS
-from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.llms import Together
 from langchain.chains import RetrievalQA
-import gradio as gr
-# Set Together.ai API key
-os.environ["TOGETHER_API_KEY"] = os.getenv("TOGETHER_API_KEY", "a36246d65d8290f43667350b364c5b6bb8562eb50a4b947eec5bd7e79f2dffc6")
 # Logging setup
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
-# Step 1: Load and chunk webpage
 def fetch_webpage_text(url):
     try:
         response = requests.get(url)
         response.raise_for_status()
         soup = BeautifulSoup(response.text, "html.parser")
-        content_div = soup.find("div", {"id": "mw-content-text"}) or soup.body
-        return content_div.get_text(separator="\n", strip=True)
     except Exception as e:
-        logger.error(f"Error fetching content from {url}: {e}")
         return ""
 def clean_text(text):
@@ -40,75 +60,75 @@ def clean_text(text):
     return text.strip()
 def chunk_text(text, chunk_size=500, overlap=50):
-    cleaned = clean_text(text)
-    splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=overlap)
-    return splitter.split_text(cleaned)
-def load_and_chunk_webpage(url):
-    text = fetch_webpage_text(url)
-    return chunk_text(text)
-# Step 2: Embed chunks using SentenceTransformer
-def embed_chunks(chunks):
-    model = SentenceTransformer('all-MiniLM-L6-v2')
-    embeddings = model.encode(chunks, normalize_embeddings=True)
-    return embeddings, model
-# Step 3: Build FAISS index using LangChain wrapper
-def build_retriever(chunks):
-    embedding_func = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
-    db = LangchainFAISS.from_texts(chunks, embedding_func)
-    return db.as_retriever(search_type="similarity", search_kwargs={"k": 3}), db
-# Step 4: Initialize LLM and RAG Chain
-def initialize_llm():
-    return Together(
-        model="meta-llama/Llama-3-8b-chat-hf",
-        temperature=0.7,
-        max_tokens=512
     )
-# Initialize all components
-wiki_url = "https://en.wikipedia.org/wiki/LLaMA"
-chunks = load_and_chunk_webpage(wiki_url)
-embeddings, embed_model = embed_chunks(chunks)
-retriever, db = build_retriever(chunks)
-llm = initialize_llm()
-qa_chain = RetrievalQA.from_chain_type(
-    llm=llm,
-    retriever=retriever,
-    chain_type="stuff"
-)
-# Chat logic
-def chat_with_bot(query):
-    if not query.strip():
-        return "❗ Please enter a question."
-    return qa_chain.run(query)
-# Summary logic
 def summarize_content():
-    sample_text = " ".join(chunks[:20])
-    prompt = f"Summarize this text in 5 bullet points:\n\n{sample_text[:3000]}"
-    summary = llm.invoke(prompt)
-    return summary.content if hasattr(summary, "content") else summary
 # Gradio UI
 with gr.Blocks() as demo:
     gr.Markdown("## 🤖 Chat with LLaMA Webpage Content")
     with gr.Row():
         chatbot = gr.Chatbot(label="Chat History")
     with gr.Row():
-        question = gr.Textbox(label="Ask your question about LLaMA", placeholder="e.g., Who developed LLaMA?")
         ask_btn = gr.Button("Submit")
         clear_btn = gr.Button("Clear Chat")
     summary_output = gr.Textbox(label="📋 Summary of the Webpage", lines=8)
     summarize_btn = gr.Button("Summarize Content")
     def user_chat_handler(q, history):
         response = chat_with_bot(q)
         history.append((q, response))
@@ -117,5 +137,6 @@ with gr.Blocks() as demo:
     ask_btn.click(fn=user_chat_handler, inputs=[question, chatbot], outputs=[chatbot, question])
     clear_btn.click(lambda: [], None, chatbot)
     summarize_btn.click(fn=summarize_content, inputs=[], outputs=summary_output)
 demo.launch()

+# app.py
 import os
 import logging
+import re
 import requests
 import numpy as np
 import faiss
+import gradio as gr
 from bs4 import BeautifulSoup
 from sentence_transformers import SentenceTransformer
 from langchain.embeddings import HuggingFaceEmbeddings
+from langchain.vectorstores.faiss import FAISS
 from langchain.llms import Together
+from langchain.text_splitter import RecursiveCharacterTextSplitter
+from langchain.chains.summarize import load_summarize_chain
+from langchain.docstore.document import Document
 from langchain.chains import RetrievalQA
+# Load your Together API key securely (recommended on HF Spaces)
+TOGETHER_API_KEY = os.environ.get("TOGETHER_API_KEY")
 # Logging setup
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
+# Load models
+logger.info("🔍 Loading sentence transformer and LLM...")
+embed_model = SentenceTransformer("all-MiniLM-L6-v2")
+llm = Together(
+    model="togethercomputer/llama-3-70b-chat",
+    temperature=0.7,
+    max_tokens=512,
+    together_api_key=TOGETHER_API_KEY,
+)
+# Global cache
+vector_index = None
+doc_chunks = []
+doc_texts = []
+doc_embeddings = []
+# Helper Functions
 def fetch_webpage_text(url):
     try:
         response = requests.get(url)
         response.raise_for_status()
         soup = BeautifulSoup(response.text, "html.parser")
+        content = soup.find("div", {"id": "mw-content-text"}) or soup.body
+        return content.get_text(separator="\n", strip=True)
     except Exception as e:
+        logger.error(f"❌ Error fetching content: {e}")
         return ""
 def clean_text(text):
     return text.strip()
 def chunk_text(text, chunk_size=500, overlap=50):
+    splitter = RecursiveCharacterTextSplitter(
+        chunk_size=chunk_size,
+        chunk_overlap=overlap
     )
+    return splitter.split_text(text)
+def create_vectorstore(chunks):
+    texts = [chunk for chunk in chunks]
+    embeddings = [embed_model.encode(text) for text in texts]
+    dim = embeddings[0].shape[0]
+    index = faiss.IndexFlatL2(dim)
+    index.add(np.array(embeddings).astype(np.float32))
+    return index, texts, embeddings
+def get_summary(chunks):
+    full_doc = Document(page_content="\n\n".join(chunks))
+    summarize_chain = load_summarize_chain(llm, chain_type="map_reduce")
+    return summarize_chain.run([full_doc])
+def chat_with_bot(question):
+    if not doc_chunks or not doc_embeddings:
+        return "⚠️ Please load a webpage and summarize it first."
+    query_vector = embed_model.encode(question).astype(np.float32)
+    index = faiss.IndexFlatL2(doc_embeddings[0].shape[0])
+    index.add(np.array(doc_embeddings).astype(np.float32))
+    D, I = index.search(np.array([query_vector]), k=5)
+    top_chunks = [doc_texts[i] for i in I[0]]
+    rag_doc = "\n\n".join(top_chunks)
+    qa_chain = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=None)
+    return qa_chain.run(input_documents=[Document(page_content=rag_doc)], question=question)
 def summarize_content():
+    if not doc_chunks:
+        return "⚠️ No content loaded yet. Please load a valid webpage."
+    return get_summary(doc_chunks)
+def process_webpage_and_load(url):
+    global doc_chunks, vector_index, doc_texts, doc_embeddings
+    logger.info(f"🌐 Loading URL: {url}")
+    text = fetch_webpage_text(url)
+    if not text:
+        return "❌ Failed to load or parse webpage."
+    cleaned = clean_text(text)
+    doc_chunks = chunk_text(cleaned)
+    vector_index, doc_texts, doc_embeddings = create_vectorstore(doc_chunks)
+    return "✅ Webpage content processed and ready!"
 # Gradio UI
 with gr.Blocks() as demo:
     gr.Markdown("## 🤖 Chat with LLaMA Webpage Content")
+    with gr.Row():
+        url_input = gr.Textbox(label="🌐 Webpage URL", placeholder="Enter a Wikipedia or article URL")
+        load_btn = gr.Button("Load Webpage")
     with gr.Row():
         chatbot = gr.Chatbot(label="Chat History")
     with gr.Row():
+        question = gr.Textbox(label="Ask your question about the webpage", placeholder="e.g., Who developed LLaMA?")
         ask_btn = gr.Button("Submit")
         clear_btn = gr.Button("Clear Chat")
     summary_output = gr.Textbox(label="📋 Summary of the Webpage", lines=8)
     summarize_btn = gr.Button("Summarize Content")
+    # Function bindings
     def user_chat_handler(q, history):
         response = chat_with_bot(q)
         history.append((q, response))
     ask_btn.click(fn=user_chat_handler, inputs=[question, chatbot], outputs=[chatbot, question])
     clear_btn.click(lambda: [], None, chatbot)
     summarize_btn.click(fn=summarize_content, inputs=[], outputs=summary_output)
+    load_btn.click(fn=process_webpage_and_load, inputs=[url_input], outputs=[summary_output])
 demo.launch()