Spaces:

helmfridsson
/

citrus

Sleeping

App Files Files Community

tomas.helmfridsson commited on Jul 24

Commit

bdb1db1

1 Parent(s): 41104fb

update 41

Browse files

Files changed (1) hide show

app.py +62 -23

app.py CHANGED Viewed

@@ -22,16 +22,22 @@ DEFAULT_TEMP   = 0.3
 K              = 10
 # ── LOGGING ─────────────────────────────────────────────────
-logging.basicConfig(level=logging.INFO, format="%(asctime)s %(levelname)s %(message)s")
 # ── 1) Bygg eller ladda FAISS-index ─────────────────────────
 emb = HuggingFaceEmbeddings(model_name=EMB_MODEL)
 if os.path.isdir(INDEX_DIR):
-    logging.info(f"🔄 Laddar befintligt FAISS-index från `{INDEX_DIR}`…")
     vs = FAISS.load_local(INDEX_DIR, emb)
 else:
-    logging.info("⚙️ Bygger nytt FAISS-index från PDF-filer…")
-    splitter = RecursiveCharacterTextSplitter(chunk_size=CHUNK_SIZE, chunk_overlap=CHUNK_OVERLAP)
     all_docs, files = [], []
     for fn in os.listdir(DOCS_DIR):
         if fn.lower().endswith(".pdf"):
@@ -45,9 +51,10 @@ else:
             files.append(fn)
     vs = FAISS.from_documents(all_docs, emb)
     vs.save_local(INDEX_DIR)
-    logging.info(f"✅ Sparade index i `{INDEX_DIR}` ({len(files)} PDF, {len(all_docs)} chunkar)")
 # ── 2) Initiera LLM ──────────────────────────────────────────
 pipe = pipeline(
     "text-generation",
     model=LLM_MODEL,
@@ -56,9 +63,12 @@ pipe = pipeline(
 )
 llm = HuggingFacePipeline(
     pipeline=pipe,
-    model_kwargs={"temperature": DEFAULT_TEMP, "max_new_tokens": MAX_NEW_TOKENS}
 )
-logging.info("✅ LLM-pipeline initierad")
 # ── 3) Bygg RetrievalQA ─────────────────────────────────────
 retriever = vs.as_retriever(search_kwargs={"k": K})
@@ -68,48 +78,76 @@ qa_chain  = RetrievalQA.from_chain_type(
     return_source_documents=False,
     chain_type="stuff"
 )
-logging.info(f"✅ RetrievalQA klar (k={K})")
 # ── 4) Gradio-funktioner ────────────────────────────────────
-def ping():
     return "pong"
 def test_retrieval(query: str) -> str:
-    hits = retriever.get_relevant_documents(query)
-    if not hits:
         return "🚫 Inga träffar"
     out = []
-    for i, d in enumerate(hits, start=1):
         src = d.metadata.get("source", "okänd")
         snippet = d.page_content.replace("\n", " ")[:200]
         out.append(f"{i}. ({src}) …{snippet}…")
     return "\n\n".join(out)
-def chat_fn(query: str, temperature: float, history: list[dict]):
-    # history är en lista av {role:..., content:...}
     history = history or []
     if not query.strip():
-        history.append({"role": "assistant", "content": "⚠️ Du måste skriva en fråga."})
         return history, history
     history.append({"role": "user", "content": query})
-    # Hämta top-K dokument och slå ihop till prompt
     docs    = retriever.get_relevant_documents(query)
     context = "\n\n---\n\n".join(d.page_content for d in docs)
     prompt  = f"Kontekst:\n{context}\n\nFråga: {query}"
-    # Sätt temperatur
-    llm.pipeline.model_kwargs["temperature"] = temperature
     try:
         svar = qa_chain.run(prompt)
     except Exception as e:
-        svar = f"❌ Fel vid QA: {e}"
     src = docs[0].metadata.get("source", "okänd") if docs else "okänd"
     content = f"**(Dokument: {src})**\n\n{svar}"
     history.append({"role": "assistant", "content": content})
     return history, history
@@ -133,10 +171,11 @@ with gr.Blocks() as demo:
     chatbot    = gr.Chatbot(type="messages", label="Chatt")
     chat_state = gr.State([])
-    # OBS: alla click-anrop använder listor för inputs/outputs
-    ping_btn.click(fn=ping, inputs=[],                   outputs=[ping_out])
-    test_btn.click(fn=test_retrieval, inputs=[txt],      outputs=[test_out])
     send.click(fn=chat_fn, inputs=[txt, temp, chat_state], outputs=[chatbot, chat_state])
 if __name__ == "__main__":
     demo.launch(share=True)

 K              = 10
 # ── LOGGING ─────────────────────────────────────────────────
+logging.basicConfig(
+    level=logging.INFO,
+    format="%(asctime)s %(levelname)s %(message)s"
+)
+logger = logging.getLogger(__name__)
 # ── 1) Bygg eller ladda FAISS-index ─────────────────────────
 emb = HuggingFaceEmbeddings(model_name=EMB_MODEL)
 if os.path.isdir(INDEX_DIR):
+    logger.info(f"🔄 Laddar befintligt FAISS-index från `{INDEX_DIR}`…")
     vs = FAISS.load_local(INDEX_DIR, emb)
 else:
+    logger.info("⚙️ Bygger nytt FAISS-index från PDF-filer…")
+    splitter = RecursiveCharacterTextSplitter(
+        chunk_size=CHUNK_SIZE, chunk_overlap=CHUNK_OVERLAP
+    )
     all_docs, files = [], []
     for fn in os.listdir(DOCS_DIR):
         if fn.lower().endswith(".pdf"):
             files.append(fn)
     vs = FAISS.from_documents(all_docs, emb)
     vs.save_local(INDEX_DIR)
+    logger.info(f"✅ Sparade index i `{INDEX_DIR}` ({len(files)} PDF, {len(all_docs)} chunkar)")
 # ── 2) Initiera LLM ──────────────────────────────────────────
+logger.info("🚀 Initierar LLM-pipeline…")
 pipe = pipeline(
     "text-generation",
     model=LLM_MODEL,
 )
 llm = HuggingFacePipeline(
     pipeline=pipe,
+    model_kwargs={
+        "temperature": DEFAULT_TEMP,
+        "max_new_tokens": MAX_NEW_TOKENS
+    }
 )
+logger.info("✅ LLM-pipeline initierad")
 # ── 3) Bygg RetrievalQA ─────────────────────────────────────
 retriever = vs.as_retriever(search_kwargs={"k": K})
     return_source_documents=False,
     chain_type="stuff"
 )
+logger.info(f"✅ RetrievalQA klar (k={K})")
 # ── 4) Gradio-funktioner ────────────────────────────────────
+def ping() -> str:
+    logger.debug("ping() anropad")
     return "pong"
 def test_retrieval(query: str) -> str:
+    logger.debug(f"test_retrieval() anropad med query={query!r}")
+    docs = retriever.get_relevant_documents(query)
+    if not docs:
         return "🚫 Inga träffar"
     out = []
+    for i, d in enumerate(docs, start=1):
         src = d.metadata.get("source", "okänd")
         snippet = d.page_content.replace("\n", " ")[:200]
         out.append(f"{i}. ({src}) …{snippet}…")
     return "\n\n".join(out)
+def chat_fn(
+    query: str,
+    temperature: float,
+    history: list[dict]
+) -> tuple[list[dict], list[dict]]:
+    """
+    query: användarens fråga
+    temperature: slump-parameter för LLM
+    history: tidigare chatt-meddelanden som lista av {"role","content"}
+    return: (uppdaterad_history, uppdaterad_history)
+    """
+    logger.info(f"chat_fn() anropad med query={query!r}, temp={temperature}, history_len={len(history) if history else 0}")
     history = history or []
+    if not isinstance(query, str):
+        msg = f"❌ Fel: query måste vara str, fick {type(query)}"
+        logger.error(msg)
+        history.append({"role": "assistant", "content": msg})
+        return history, history
     if not query.strip():
+        msg = "⚠️ Du måste skriva en fråga."
+        logger.warning(msg)
+        history.append({"role": "assistant", "content": msg})
         return history, history
     history.append({"role": "user", "content": query})
+    # Bygg prompt
     docs    = retriever.get_relevant_documents(query)
     context = "\n\n---\n\n".join(d.page_content for d in docs)
     prompt  = f"Kontekst:\n{context}\n\nFråga: {query}"
+    logger.debug(f"Prompt till QA-kedjan: {prompt[:200]}...")
+    # Justera temp
+    try:
+        llm.pipeline.model_kwargs["temperature"] = temperature
+    except Exception as e:
+        logger.exception("Kunde inte sätta temperature")
     try:
         svar = qa_chain.run(prompt)
     except Exception as e:
+        logger.exception("Fel vid anrop av qa_chain")
+        svar = f"❌ Fel vid QA-kedjan: {e}"
+    # Ange källa
     src = docs[0].metadata.get("source", "okänd") if docs else "okänd"
     content = f"**(Dokument: {src})**\n\n{svar}"
     history.append({"role": "assistant", "content": content})
+    logger.info(f"chat_fn färdig, svarslängd={len(svar)} tecken, totalt history={len(history)}")
     return history, history
     chatbot    = gr.Chatbot(type="messages", label="Chatt")
     chat_state = gr.State([])
+    ping_btn.click(fn=ping, inputs=[], outputs=[ping_out])
+    test_btn.click(fn=test_retrieval, inputs=[txt], outputs=[test_out])
     send.click(fn=chat_fn, inputs=[txt, temp, chat_state], outputs=[chatbot, chat_state])
 if __name__ == "__main__":
+    # share=True om du vill publikt dela länken
     demo.launch(share=True)