LIFineTuned

Paused

alexkueck commited on Jun 21, 2023

Commit

cc37d8c

1 Parent(s): 6759744

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -44,7 +44,7 @@ xxx = os.getenv("TOKEN")
 login(token=xxx)
 #Modelle und Tokenizer
 model_name = "alexkueck/LIFineTuned"
-print(f"{model_name}/model/")
 #Alternativ mit beliebigen Modellen:
 base_model = "project-baize/baize-v2-7b"  #load_8bit = False (in load_tokenizer_and_model)
 #base_model = "TheBloke/airoboros-13B-HF"  #load_8bit = False (in load_tokenizer_and_model)
@@ -63,6 +63,7 @@ dataset_neu = daten_laden("alexkueck/tis")
 tokenized_datasets = dataset_neu.map(tokenize_function, batched=True, num_proc=4, remove_columns=["id","text"])
 print (tokenized_datasets["train"][4])
 #den Text nun zusammenführen (concatenieren) und anschließend in kleine Häppchen aufteilen (block_size=128), die verarbeitet werden können
 #das macht die map-Funktion und das Attribut batched = True
 #man könnte das weglassen, wenn jeder Satz einzeln gegeben wurde in den Texten...

 login(token=xxx)
 #Modelle und Tokenizer
 model_name = "alexkueck/LIFineTuned"
 #Alternativ mit beliebigen Modellen:
 base_model = "project-baize/baize-v2-7b"  #load_8bit = False (in load_tokenizer_and_model)
 #base_model = "TheBloke/airoboros-13B-HF"  #load_8bit = False (in load_tokenizer_and_model)
 tokenized_datasets = dataset_neu.map(tokenize_function, batched=True, num_proc=4, remove_columns=["id","text"])
 print (tokenized_datasets["train"][4])
+print(f"{model_name}/model/")
 #den Text nun zusammenführen (concatenieren) und anschließend in kleine Häppchen aufteilen (block_size=128), die verarbeitet werden können
 #das macht die map-Funktion und das Attribut batched = True
 #man könnte das weglassen, wenn jeder Satz einzeln gegeben wurde in den Texten...