Spaces:

ejschwartz
/

test

Runtime error

ejschwartz commited on 23 days ago

Commit

d5e44b4

1 Parent(s): 803e1b0

Name constants

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,6 +11,10 @@ import huggingface_hub
 import prep_decompiled
 hf_key = os.environ["HF_TOKEN"]
 huggingface_hub.login(token=hf_key)
@@ -85,11 +89,11 @@ def infer(code):
     print(f"Prompt:\n{repr(var_prompt)}")
     var_input_ids = tokenizer.encode(var_prompt, return_tensors="pt").cuda()[
-        :, : 8192 - 1024
     ]
     var_output = vardecoder_model.generate(
         input_ids=var_input_ids,
-        max_new_tokens=1024,
         num_beams=4,
         num_return_sequences=1,
         do_sample=False,
@@ -112,12 +116,12 @@ def infer(code):
         field_output = "Failed to parse fields" if field_prompt_result is None else "No fields"
     else:
         field_input_ids = tokenizer.encode(field_prompt_result, return_tensors="pt").cuda()[
-            :, : 8192 - 1024
         ]
         field_output = fielddecoder_model.generate(
             input_ids=field_input_ids,
-            max_new_tokens=1024,
             num_beams=4,
             num_return_sequences=1,
             do_sample=False,

 import prep_decompiled
+# Model configuration constants
+MAX_CONTEXT_LENGTH = 8192
+MAX_NEW_TOKENS = 1024
 hf_key = os.environ["HF_TOKEN"]
 huggingface_hub.login(token=hf_key)
     print(f"Prompt:\n{repr(var_prompt)}")
     var_input_ids = tokenizer.encode(var_prompt, return_tensors="pt").cuda()[
+        :, : MAX_CONTEXT_LENGTH - MAX_NEW_TOKENS
     ]
     var_output = vardecoder_model.generate(
         input_ids=var_input_ids,
+        max_new_tokens=MAX_NEW_TOKENS,
         num_beams=4,
         num_return_sequences=1,
         do_sample=False,
         field_output = "Failed to parse fields" if field_prompt_result is None else "No fields"
     else:
         field_input_ids = tokenizer.encode(field_prompt_result, return_tensors="pt").cuda()[
+            :, : MAX_CONTEXT_LENGTH - MAX_NEW_TOKENS
         ]
         field_output = fielddecoder_model.generate(
             input_ids=field_input_ids,
+            max_new_tokens=MAX_NEW_TOKENS,
             num_beams=4,
             num_return_sequences=1,
             do_sample=False,