Spaces:

oceddyyy
/

QandA_Generator

Sleeping

App Files Files Community

oceddyyy commited on May 8

Commit

5bfb4f3

verified ·

1 Parent(s): bc438d9

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -7

app.py CHANGED Viewed

@@ -9,6 +9,7 @@ from datetime import datetime
 from spacy.cli import download
 try:
     nlp = spacy.load("en_core_web_sm")
 except OSError:
@@ -16,7 +17,7 @@ except OSError:
     download("en_core_web_sm")
     nlp = spacy.load("en_core_web_sm")
 qg_model = AutoModelForSeq2SeqLM.from_pretrained("valhalla/t5-base-qa-qg-hl")
 qg_tokenizer = AutoTokenizer.from_pretrained("valhalla/t5-base-qa-qg-hl", use_fast=True)
 qg_pipeline = pipeline("text2text-generation", model=qg_model, tokenizer=qg_tokenizer)
@@ -82,11 +83,16 @@ def save_json_to_dataset(json_str):
         if not hf_token:
             return "❌ HF_TOKEN not found in environment."
-        repo_id = "University_Inquiries_AI_Chatbot"
         dataset_file = "dataset.json"
         local_dir = "hf_repo"
-        repo = Repository(local_dir=local_dir, clone_from="datasets/oceddyyy/University_Inquiries_AI_Chatbot", use_auth_token=hf_token)
         repo.git_pull()
@@ -102,8 +108,8 @@ def save_json_to_dataset(json_str):
         now = datetime.now()
         for entry in new_data:
-            entry["month"] = now.strftime("%B")
-            entry["year"] = now.year
         updated_data = existing_data + new_data
@@ -116,7 +122,6 @@ def save_json_to_dataset(json_str):
     except Exception as e:
         return f"❌ Error: {str(e)}"
 def on_extract_facts(text):
     facts = extract_paragraph_facts(text)
     default_fact = facts[0] if facts else None
@@ -163,7 +168,6 @@ def main():
             placeholder='{\n"question": "Your question?",\n"answer": "Your answer."\n},'
         )
         with gr.Row():
             generate_btn = gr.Button("Generate Q&A")
             send_btn = gr.Button("📤 Send to Dataset")

 from spacy.cli import download
+# Load or download the spaCy model
 try:
     nlp = spacy.load("en_core_web_sm")
 except OSError:
     download("en_core_web_sm")
     nlp = spacy.load("en_core_web_sm")
+# Load question generation model
 qg_model = AutoModelForSeq2SeqLM.from_pretrained("valhalla/t5-base-qa-qg-hl")
 qg_tokenizer = AutoTokenizer.from_pretrained("valhalla/t5-base-qa-qg-hl", use_fast=True)
 qg_pipeline = pipeline("text2text-generation", model=qg_model, tokenizer=qg_tokenizer)
         if not hf_token:
             return "❌ HF_TOKEN not found in environment."
+        repo_id = "UniversityAIChatbot/University_Inquiries_AI_Chatbot"
         dataset_file = "dataset.json"
         local_dir = "hf_repo"
+        repo = Repository(
+            local_dir=local_dir,
+            clone_from=f"datasets/{repo_id}",
+            use_auth_token=hf_token,
+            repo_type="dataset"
+        )
         repo.git_pull()
         now = datetime.now()
         for entry in new_data:
+            entry["month"] = now.strftime("%B")
+            entry["year"] = now.year
         updated_data = existing_data + new_data
     except Exception as e:
         return f"❌ Error: {str(e)}"
 def on_extract_facts(text):
     facts = extract_paragraph_facts(text)
     default_fact = facts[0] if facts else None
             placeholder='{\n"question": "Your question?",\n"answer": "Your answer."\n},'
         )
         with gr.Row():
             generate_btn = gr.Button("Generate Q&A")
             send_btn = gr.Button("📤 Send to Dataset")