Spaces:

h2oai
/

h2ogpt-chatbot

Running

App Files Files Community

pseudotensor commited on May 2, 2023

Commit

afada69

1 Parent(s): 31f9cfa

Update with h2oGPT hash f06eaae17d5d0c548fd962288427b535048b47f3

Browse files

Files changed (1) hide show

generate.py +7 -4

generate.py CHANGED Viewed

@@ -4,7 +4,7 @@ import os
 import traceback
 import typing
 from threading import Thread
 import filelock
 import psutil
@@ -114,7 +114,7 @@ def main(
     if is_public:
         input_lines = 1  # ensure set, for ease of use
-        temperature = 0.4
         top_p = 0.85
         top_k = 70
         do_sample = True
@@ -834,7 +834,10 @@ def evaluate(
         # https://github.com/h2oai/h2ogpt/issues/104
         # but only makes sense if concurrency_count == 1
         context_class = NullContext if concurrency_count > 1 else filelock.FileLock
         with context_class("generate.lock"):
             # decoded tokenized prompt can deviate from prompt due to special characters
             inputs_decoded = decoder(input_ids[0])
             inputs_decoded_raw = decoder_raw(input_ids[0])
@@ -850,7 +853,6 @@ def evaluate(
                 decoder = decoder_raw
             else:
                 print("WARNING: Special characters in prompt", flush=True)
-            decoded_output = None
             if stream_output:
                 skip_prompt = False
                 streamer = TextIteratorStreamer(tokenizer, skip_prompt=skip_prompt)
@@ -875,6 +877,7 @@ def evaluate(
                     decoded_output = prompt + outputs[0]
             if save_dir and decoded_output:
                 save_generate_output(output=decoded_output, base_model=base_model, save_dir=save_dir)
 def generate_with_exceptions(func, prompt, inputs_decoded, raise_generate_gpu_exceptions, **kwargs):
@@ -1017,7 +1020,7 @@ Philipp: ok, ok you can find everything here. https://huggingface.co/blog/the-pa
         num_return_sequences = min(num_beams, num_return_sequences or 1)
         do_sample = False if do_sample is None else do_sample
     else:
-        temperature = 0.4 if temperature is None else temperature
         top_p = 0.85 if top_p is None else top_p
         top_k = 70 if top_k is None else top_k
         if chat:

 import traceback
 import typing
 from threading import Thread
+from datetime import datetime
 import filelock
 import psutil
     if is_public:
         input_lines = 1  # ensure set, for ease of use
+        temperature = 0.2
         top_p = 0.85
         top_k = 70
         do_sample = True
         # https://github.com/h2oai/h2ogpt/issues/104
         # but only makes sense if concurrency_count == 1
         context_class = NullContext if concurrency_count > 1 else filelock.FileLock
+        print('Pre-Generate: %s' % str(datetime.now()), flush=True)
+        decoded_output = None
         with context_class("generate.lock"):
+            print('Generate: %s' % str(datetime.now()), flush=True)
             # decoded tokenized prompt can deviate from prompt due to special characters
             inputs_decoded = decoder(input_ids[0])
             inputs_decoded_raw = decoder_raw(input_ids[0])
                 decoder = decoder_raw
             else:
                 print("WARNING: Special characters in prompt", flush=True)
             if stream_output:
                 skip_prompt = False
                 streamer = TextIteratorStreamer(tokenizer, skip_prompt=skip_prompt)
                     decoded_output = prompt + outputs[0]
             if save_dir and decoded_output:
                 save_generate_output(output=decoded_output, base_model=base_model, save_dir=save_dir)
+        print('Post-Generate: %s decoded_output: %s' % (str(datetime.now()), len(decoded_output) if decoded_output else -1), flush=True)
 def generate_with_exceptions(func, prompt, inputs_decoded, raise_generate_gpu_exceptions, **kwargs):
         num_return_sequences = min(num_beams, num_return_sequences or 1)
         do_sample = False if do_sample is None else do_sample
     else:
+        temperature = 0.2 if temperature is None else temperature
         top_p = 0.85 if top_p is None else top_p
         top_k = 70 if top_k is None else top_k
         if chat: