Spaces:

ak0601
/

Eng_tutor

Build error

ak0601 commited on Dec 20, 2024

Commit

485985e

verified ·

1 Parent(s): 7c41cdb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,6 +3,7 @@ from langchain.document_loaders import PyPDFLoader
 from langchain.document_loaders import TextLoader
 from langchain.document_loaders import Docx2txtLoader
 from langchain.text_splitter import CharacterTextSplitter
 from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.vectorstores import Chroma
 from huggingface_hub import notebook_login
@@ -37,7 +38,7 @@ llm = ChatGoogleGenerativeAI(
     max_retries=2,
 )
-# Initialize embeddings using OpenAI
 embeddings = HuggingFaceEmbeddings(model_name='sentence-transformers/all-mpnet-base-v2')
 def load_preprocessed_vectorstore():
@@ -58,12 +59,7 @@ def load_preprocessed_vectorstore():
             document_chunks = text_splitter.split_documents(document)
-            vector_store = Chroma.from_documents(
-            embedding=embeddings,
-            documents=document_chunks,
-            persist_directory="./data32"
-            )
             return vector_store
     except Exception as e:
         st.error(f"Error creating vector store: {e}")

 from langchain.document_loaders import TextLoader
 from langchain.document_loaders import Docx2txtLoader
 from langchain.text_splitter import CharacterTextSplitter
+from langchain_text_splitters import RecursiveCharacterTextSplitter
 from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.vectorstores import Chroma
 from huggingface_hub import notebook_login
     max_retries=2,
 )
 embeddings = HuggingFaceEmbeddings(model_name='sentence-transformers/all-mpnet-base-v2')
 def load_preprocessed_vectorstore():
             document_chunks = text_splitter.split_documents(document)
+        vector_store =Chroma.from_documents(document_chunks,embedding=embeddings, persist_directory='./data')
             return vector_store
     except Exception as e:
         st.error(f"Error creating vector store: {e}")