SearchGPT

Running

Shreyas094 commited on Jul 24, 2024

Commit

d6312bb

verified ·

1 Parent(s): a3a121b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -70,7 +70,7 @@ def update_vectors(files, parser):
     return f"Vector store updated successfully. Processed {total_chunks} chunks from {len(files)} files using {parser}."
-def generate_chunked_response(prompt, max_tokens=1000, max_chunks=5, temperature=0.2, repetition_penalty=1.1):
     client = InferenceClient(
         "meta-llama/Meta-Llama-3.1-8B-Instruct",
         token=huggingface_token,
@@ -84,7 +84,7 @@ def generate_chunked_response(prompt, max_tokens=1000, max_chunks=5, temperature
             chunk_response = ""
             for message in client.chat_completion(
                 messages=messages,
-                max_new_tokens=max_tokens,
                 temperature=temperature,
                 repetition_penalty=repetition_penalty,
                 stream=True,

     return f"Vector store updated successfully. Processed {total_chunks} chunks from {len(files)} files using {parser}."
+def generate_chunked_response(prompt, max_tokens=1000, max_chunks=5, temperature=0.7, repetition_penalty=1.1):
     client = InferenceClient(
         "meta-llama/Meta-Llama-3.1-8B-Instruct",
         token=huggingface_token,
             chunk_response = ""
             for message in client.chat_completion(
                 messages=messages,
+                max_tokens=max_tokens,  # Changed from max_new_tokens to max_tokens
                 temperature=temperature,
                 repetition_penalty=repetition_penalty,
                 stream=True,