Spaces:

masadonline
/

Quasa

Sleeping

App Files Files Community

masadonline commited on May 16

Commit

210135b

verified ·

1 Parent(s): 108920c

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -31

app.py CHANGED Viewed

@@ -1,60 +1,58 @@
-import os
 import streamlit as st
 from langchain_community.document_loaders import PyPDFLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.vectorstores import FAISS
 from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.chains import RetrievalQA
-from langchain_community.chat_models import ChatGroq
-# Set Streamlit page config
-st.set_page_config(page_title="SMEHelpBot 🤖", layout="wide")
-st.title("🤖 SMEHelpBot – Your AI Assistant for Small Businesses")
-# File uploader
-uploaded_file = st.file_uploader("📄 Upload a PDF (e.g., SME policy, business doc, etc.):", type=["pdf"])
-user_question = st.text_input("💬 Ask a question related to your document or SME operations:")
-# Set Groq API key securely (use Streamlit secrets or env var)
-GROQ_API_KEY = st.secrets.get("GROQ_API_KEY") or os.getenv("GROQ_API_KEY") or "your_groq_api_key_here"
 if uploaded_file:
-    # Save uploaded file temporarily
     with open("temp.pdf", "wb") as f:
         f.write(uploaded_file.read())
-    # Load PDF and split into chunks
     loader = PyPDFLoader("temp.pdf")
-    documents = loader.load()
     splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
-    chunks = splitter.split_documents(documents)
-    # Create vector store using MiniLM embeddings
     embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
-    vectorstore = FAISS.from_documents(chunks, embeddings)
-    retriever = vectorstore.as_retriever()
-    # Set up LLM using Groq + LLaMA3
-    os.environ["GROQ_API_KEY"] = GROQ_API_KEY
-    llm = ChatGroq(temperature=0.3, model_name="llama3-8b-8192")
-    # QA chain with retrieval
-    qa = RetrievalQA.from_chain_type(
         llm=llm,
-        chain_type="stuff",
         retriever=retriever,
         return_source_documents=True
     )
-    if user_question:
-        with st.spinner("Generating answer..."):
-            result = qa({"query": user_question})
             st.success(result["result"])
-            with st.expander("📄 Sources"):
                 for doc in result["source_documents"]:
-                    st.markdown(f"• {doc.page_content[:300]}...")
 else:
-    st.info("Upload a PDF and enter a question to begin.")

 import streamlit as st
 from langchain_community.document_loaders import PyPDFLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.vectorstores import FAISS
 from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.chains import RetrievalQA
+from langchain_community.llms import HuggingFaceEndpoint
+import os
+# --- UI ---
+st.set_page_config(page_title="SMEHelpBot", layout="wide")
+st.title("🤖 SMEHelpBot – Your AI Assistant for Small Business")
+uploaded_file = st.file_uploader("📄 Upload an industry-specific PDF (policy, FAQ, etc.):", type=["pdf"])
+user_query = st.text_input("💬 Ask a business-related question:")
+# --- Process PDF + RAG ---
 if uploaded_file:
     with open("temp.pdf", "wb") as f:
         f.write(uploaded_file.read())
     loader = PyPDFLoader("temp.pdf")
+    pages = loader.load()
     splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
+    chunks = splitter.split_documents(pages)
     embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
+    db = FAISS.from_documents(chunks, embeddings)
+    retriever = db.as_retriever()
+    # --- Groq API (LLaMA3 via HuggingFaceEndpoint) ---
+    os.environ["HUGGINGFACEHUB_API_TOKEN"] = st.secrets.get("HF_TOKEN") or "your_api_token_here"
+    llm = HuggingFaceEndpoint(
+        repo_id="meta-llama/Meta-Llama-3-8B-Instruct",
+        temperature=0.6,
+        max_new_tokens=512
+    )
+    qa_chain = RetrievalQA.from_chain_type(
         llm=llm,
         retriever=retriever,
         return_source_documents=True
     )
+    if user_query:
+        with st.spinner("Generating response..."):
+            result = qa_chain({"query": user_query})
             st.success(result["result"])
+            with st.expander("📚 Sources"):
                 for doc in result["source_documents"]:
+                    st.markdown(f"• Page content: {doc.page_content[:300]}...")
 else:
+    st.info("Upload a PDF and type your question to get started.")