Spaces:

random2222
/

tryagain

Build error

App Files Files Community

random2222 commited on Apr 14

Commit

c7f06c3

verified ·

1 Parent(s): 7a39638

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -15

app.py CHANGED Viewed

@@ -2,16 +2,16 @@ import os
 import gc
 import torch
 import gradio as gr
-from langchain.document_loaders import PyMuPDFLoader, TextLoader
 from langchain.text_splitter import CharacterTextSplitter
-from langchain.vectorstores import FAISS
-from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.chains import RetrievalQA
-from langchain.llms import HuggingFacePipeline
 from transformers import pipeline, AutoTokenizer, BitsAndBytesConfig
 from huggingface_hub import login
-# Handle HF token securely
 if os.environ.get("HF_TOKEN"):
     login(token=os.environ["HF_TOKEN"])
@@ -29,7 +29,7 @@ def load_documents(file_path="study_materials"):
 def create_qa_system():
     try:
-        # Load and split documents
         documents = load_documents()
         if not documents:
             raise ValueError("📚 No study materials found")
@@ -49,13 +49,7 @@ def create_qa_system():
         # Vector store
         db = FAISS.from_documents(texts, embeddings)
-        # Quantization config
-        quant_config = BitsAndBytesConfig(
-            load_in_8bit=True,
-            llm_int8_threshold=6.0
-        )
-        # LLM setup with optimizations
         tokenizer = AutoTokenizer.from_pretrained("google/flan-t5-large")
         pipe = pipeline(
             "text2text-generation",
@@ -68,14 +62,13 @@ def create_qa_system():
             device=-1,  # Force CPU usage
             model_kwargs={
                 "torch_dtype": torch.float16,
-                "quantization_config": quant_config
             }
         )
         # Memory cleanup
         gc.collect()
-        # Create QA system
         return RetrievalQA.from_llm(
             llm=HuggingFacePipeline(pipeline=pipe),
             retriever=db.as_retriever(search_kwargs={"k": 3}),

 import gc
 import torch
 import gradio as gr
+from langchain_community.document_loaders import PyMuPDFLoader, TextLoader
 from langchain.text_splitter import CharacterTextSplitter
+from langchain_community.vectorstores import FAISS
+from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain.chains import RetrievalQA
+from langchain_community.llms import HuggingFacePipeline
 from transformers import pipeline, AutoTokenizer, BitsAndBytesConfig
 from huggingface_hub import login
+# HF Token handling
 if os.environ.get("HF_TOKEN"):
     login(token=os.environ["HF_TOKEN"])
 def create_qa_system():
     try:
+        # Load and process documents
         documents = load_documents()
         if not documents:
             raise ValueError("📚 No study materials found")
         # Vector store
         db = FAISS.from_documents(texts, embeddings)
+        # LLM setup with CPU optimizations
         tokenizer = AutoTokenizer.from_pretrained("google/flan-t5-large")
         pipe = pipeline(
             "text2text-generation",
             device=-1,  # Force CPU usage
             model_kwargs={
                 "torch_dtype": torch.float16,
+                "low_cpu_mem_usage": True
             }
         )
         # Memory cleanup
         gc.collect()
         return RetrievalQA.from_llm(
             llm=HuggingFacePipeline(pipeline=pipe),
             retriever=db.as_retriever(search_kwargs={"k": 3}),