Spaces:

helmfridsson
/

citrus

Sleeping

App Files Files Community

tomas.helmfridsson commited on Jul 23

Commit

30881d9

1 Parent(s): ad7b39c

update 31

Browse files

Files changed (1) hide show

app.py +75 -37

app.py CHANGED Viewed

@@ -1,6 +1,9 @@
 import os
 import gradio as gr
-from transformers import pipeline
 from langchain_community.document_loaders import PyPDFLoader
 from langchain_community.vectorstores import FAISS
 from langchain_huggingface.embeddings import HuggingFaceEmbeddings
@@ -8,93 +11,128 @@ from langchain_huggingface.llms import HuggingFacePipeline
 from langchain.chains import RetrievalQA
 from langchain.text_splitter import RecursiveCharacterTextSplitter
-# ── 1) Ladda PDF:er och dela upp i korta chunkar ────────────
 all_docs, files = [], []
 splitter = RecursiveCharacterTextSplitter(chunk_size=250, chunk_overlap=30)
 for fn in os.listdir("document"):
     if fn.lower().endswith(".pdf"):
-        path = os.path.join("document", fn)
         loader = PyPDFLoader(path)
-        pages = loader.load()                      # en lista av Document-objekt
-        chunks = splitter.split_documents(pages)   # dela upp i mindre bitar
         all_docs.extend(chunks)
         files.append(fn)
-# ── 2) Skapa vektorer med svenska embeddings ────────────────
 emb = HuggingFaceEmbeddings(model_name="KBLab/sentence-bert-swedish-cased")
 vs  = FAISS.from_documents(all_docs, emb)
-# ── 3) Initiera LLM-pipeline (CPU-only) ───────────────────────
 pipe = pipeline(
     "text-generation",
     model="tiiuae/falcon-rw-1b",
-    device=-1,               # CPU
-    max_new_tokens=64        # kortare svar → snabbare
 )
 llm = HuggingFacePipeline(
     pipeline=pipe,
     model_kwargs={"temperature": 0.3}
 )
-# ── 4) Bygg RetrievalQA med bara 1 chunk ────────────────────
 retriever = vs.as_retriever(search_kwargs={"k": 1})
 qa = RetrievalQA.from_chain_type(
     llm=llm,
     retriever=retriever,
     chain_type="stuff"
 )
-# ── 5) Chat-funktion som returnerar både history & state ─────
 def chat_fn(message, temperature, history):
     history = history or []
     if not message.strip():
-        history.append({"role": "assistant", "content": "⚠️ Du måste skriva en fråga."})
         return history, history
     # Lägg till användarens fråga
-    history.append({"role": "user", "content": message})
-    # För långa frågor
     if len(message) > 1000:
-        history.append({
-            "role": "assistant",
-            "content": f"⚠️ Frågan är för lång ({len(message)} tecken)."
-        })
         return history, history
     # Justera temperatur
     llm.model_kwargs["temperature"] = temperature
-    # Kör RAG-kedjan
     try:
-        svar = qa.invoke({"query": message})["result"]
     except Exception as e:
-        svar = f"❌ Ett fel uppstod: {e}"
-    history.append({"role": "assistant", "content": svar})
     return history, history
-# ── 6) Bygg Gradio-UI & publicera ─────────────────────────────
 with gr.Blocks() as demo:
-    gr.Markdown("## 🌟 Dokumentassistent (Svenska)")
     gr.Markdown("**✅ Laddade PDF-filer:**\n\n" + "\n".join(f"- {f}" for f in files))
     with gr.Row():
-        txt   = gr.Textbox(
-            lines=2,
-            label="Din fråga:",
-            placeholder="Exempel: Vad anges förberedelser inför möte?"
-        )
-        temp  = gr.Slider(
-            0.0, 1.0, value=0.3, step=0.05,
-            label="Temperatur"
-        )
-        send  = gr.Button("Skicka")
-    chatbot    = gr.Chatbot(value=[], type="messages")
     chat_state = gr.State([])
     send.click(
         fn=chat_fn,
         inputs=[txt, temp, chat_state],
@@ -102,5 +140,5 @@ with gr.Blocks() as demo:
     )
 if __name__ == "__main__":
-    # share=True ger en publik länk till ditt Space
     demo.launch(share=True)

 import os
+import time
+import logging
 import gradio as gr
+from transformers import pipeline, logging as hf_logging
 from langchain_community.document_loaders import PyPDFLoader
 from langchain_community.vectorstores import FAISS
 from langchain_huggingface.embeddings import HuggingFaceEmbeddings
 from langchain.chains import RetrievalQA
 from langchain.text_splitter import RecursiveCharacterTextSplitter
+# ── 1) Setup logging ───────────────────────────────────────────
+logging.basicConfig(
+    format="%(asctime)s %(levelname)s %(message)s",
+    level=logging.INFO
+)
+# Gör Transformers mer detaljerade i loggarna
+hf_logging.set_verbosity_debug()
+# ── 2) Ladda & chunka PDF:er ────────────────────────────────────
 all_docs, files = [], []
 splitter = RecursiveCharacterTextSplitter(chunk_size=250, chunk_overlap=30)
 for fn in os.listdir("document"):
     if fn.lower().endswith(".pdf"):
+        path   = os.path.join("document", fn)
         loader = PyPDFLoader(path)
+        pages  = loader.load()
+        chunks = splitter.split_documents(pages)
         all_docs.extend(chunks)
         files.append(fn)
+logging.info(f"✅ Laddade och chunkade {len(files)} PDF:er → totalt {len(all_docs)} chunkar")
+# ── 3) Skapa embedding + FAISS───────────────────────────────────
 emb = HuggingFaceEmbeddings(model_name="KBLab/sentence-bert-swedish-cased")
 vs  = FAISS.from_documents(all_docs, emb)
+logging.info("✅ FAISS-vektorstore skapat")
+# ── 4) Initiera CPU-pipeline för Falcon-1B───────────────────────
 pipe = pipeline(
     "text-generation",
     model="tiiuae/falcon-rw-1b",
+    device=-1,
+    max_new_tokens=64
 )
 llm = HuggingFacePipeline(
     pipeline=pipe,
     model_kwargs={"temperature": 0.3}
 )
+logging.info("✅ LLM-pipeline initierad (CPU, max_new_tokens=64)")
+# ── 5) Bygg RetrievalQA med bara 1 chunk───────────────────────
 retriever = vs.as_retriever(search_kwargs={"k": 1})
 qa = RetrievalQA.from_chain_type(
     llm=llm,
     retriever=retriever,
     chain_type="stuff"
 )
+logging.info("✅ RetrievalQA-kedja skapad (k=1)")
+# ── 6) Ping-funktion för sanity-check────────────────────────────
+def ping():
+    logging.info("🏓 Ping mottagen")
+    return "pong"
+# ── 7) Chat-funktion som returnerar list-of-tuples────────────────
 def chat_fn(message, temperature, history):
+    start_time = time.time()
     history = history or []
+    logging.info(f"→ chat_fn start – message={message!r}, temp={temperature}")
+    # Tom fråga?
     if not message.strip():
+        history.append(("assistant", "⚠️ Du måste skriva en fråga."))
+        logging.info("← chat_fn exit – tom fråga")
         return history, history
     # Lägg till användarens fråga
+    history.append(("user", message))
+    # För lång fråga?
     if len(message) > 1000:
+        warn = f"⚠️ Frågan är för lång ({len(message)} tecken)."
+        history.append(("assistant", warn))
+        logging.info("← chat_fn exit – för lång fråga")
         return history, history
     # Justera temperatur
     llm.model_kwargs["temperature"] = temperature
+    # Retrieval
+    t0 = time.time()
+    docs = retriever.get_relevant_documents(message)
+    logging.info(f"  🔍 Retrieval tog {time.time() - t0:.2f}s, hittade {len(docs)} docs")
+    # Inference
+    t1 = time.time()
     try:
+        result = qa.invoke({"query": message})["result"]
+        logging.info(f"  🤖 QA.invoke tog {time.time() - t1:.2f}s")
     except Exception as e:
+        logging.exception("❌ Fel i QA.invoke")
+        result = f"Fel vid QA: {e}"
+    # Lägg till svaret
+    history.append(("assistant", result))
+    logging.info(f"← chat_fn klar på {time.time() - start_time:.2f}s med {len(history)} meddelanden")
     return history, history
+# ── 8) Bygg Gradio-UI & lansera publicerat────────────────────────
 with gr.Blocks() as demo:
+    gr.Markdown("# 🌟 Dokumentassistent (Svenska)")
     gr.Markdown("**✅ Laddade PDF-filer:**\n\n" + "\n".join(f"- {f}" for f in files))
     with gr.Row():
+        # Ping-test
+        ping_btn = gr.Button("🏓 Ping")
+        ping_out = gr.Textbox(label="Ping-svar")
+        # RAG-chat
+        txt  = gr.Textbox(lines=2, label="Din fråga:", placeholder="Ex: Vad anges för krav?")
+        temp = gr.Slider(0.0, 1.0, value=0.3, step=0.05, label="Temperatur")
+        send = gr.Button("📨 Skicka")
+    chatbot    = gr.Chatbot()            # default == tuple-format
     chat_state = gr.State([])
+    # Koppla Ping
+    ping_btn.click(fn=ping, inputs=[], outputs=[ping_out])
+    # Koppla chat
     send.click(
         fn=chat_fn,
         inputs=[txt, temp, chat_state],
     )
 if __name__ == "__main__":
     demo.launch(share=True)