Spaces:

k3ybladewielder
/

cloudwalk_swarm

Sleeping

k3ybladewielder commited on 19 days ago

Commit

c08d114

verified ·

1 Parent(s): 046188a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -82,7 +82,7 @@ def get_llm():
     # Atualizando o nome do modelo para carregar o tokenizer correto,
     # mesmo que o arquivo GGUF seja de outro repo.
     # O tokenizer ainda deve ser compatível com o modelo base "google/gemma-2b-it".
-    TOKENIZER_MODEL = "google/gemma-2b-it"
     model_path = os.path.join(CACHE_FOLDER, LOCAL_MODEL_FILE)
     logger.info(f"Carregando LLM quantizado localmente: {LOCAL_MODEL_FILE}")
@@ -135,7 +135,7 @@ def get_llm():
             "text-generation",
             model=model,
             tokenizer=tokenizer,
-            max_new_tokens=1024,
             temperature=0.3,
             # Parâmetros de parada para evitar que o modelo continue a gerar após a resposta
             # Note: stop_sequence pode não ser universalmente suportado por todas as pipelines/modelos

     # Atualizando o nome do modelo para carregar o tokenizer correto,
     # mesmo que o arquivo GGUF seja de outro repo.
     # O tokenizer ainda deve ser compatível com o modelo base "google/gemma-2b-it".
+    TOKENIZER_MODEL = LLM_MODEL
     model_path = os.path.join(CACHE_FOLDER, LOCAL_MODEL_FILE)
     logger.info(f"Carregando LLM quantizado localmente: {LOCAL_MODEL_FILE}")
             "text-generation",
             model=model,
             tokenizer=tokenizer,
+            max_new_tokens=520,
             temperature=0.3,
             # Parâmetros de parada para evitar que o modelo continue a gerar após a resposta
             # Note: stop_sequence pode não ser universalmente suportado por todas as pipelines/modelos