Spaces:

Cylanoid
/

Nursing-Home-Fraud-Detection-using-Llama

Paused

App Files Files Community

Cylanoid commited on Mar 5

Commit

bf713b8

verified ·

1 Parent(s): 53d6f71

Update app.py

Browse files

Files changed (1) hide show

app.py +98 -29

app.py CHANGED Viewed

@@ -1,17 +1,65 @@
-import gradio as gr
-from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments, DataCollatorForSeq2Seq
-import datasets
-import torch
-import json
-import os
-import accelerate
-except ImportError:
-    os.system('pip install "accelerate>=0.26.0"')
 # Model setup
-MODEL_ID = "facebook/opt-350m"  # Smaller, open access model
-tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
-model = AutoModelForCausalLM.from_pretrained(MODEL_ID, torch_dtype=torch.float16, device_map="auto")
 # Function to process uploaded JSON and train
 def train_ui_tars(file):
@@ -31,51 +79,73 @@ def train_ui_tars(file):
         # Load dataset
         dataset = datasets.load_dataset("json", data_files=fixed_json_path)
-        # Step 2: Tokenize dataset
         def tokenize_data(example):
-            inputs = tokenizer(example["input"], padding="max_length", truncation=True, max_length=512)
-            targets = tokenizer(example["output"], padding="max_length", truncation=True, max_length=512)
-            inputs["labels"] = targets["input_ids"]
-            return inputs
-        tokenized_dataset = dataset.map(tokenize_data, batched=True)
         # Step 3: Training setup
         training_args = TrainingArguments(
-            output_dir="./fine_tuned_llama2",
-            per_device_train_batch_size=2,
             evaluation_strategy="no",
             save_strategy="epoch",
             save_total_limit=2,
             num_train_epochs=3,
             learning_rate=2e-5,
             weight_decay=0.01,
-            logging_dir="./logs"
         )
         trainer = Trainer(
             model=model,
             args=training_args,
-            train_dataset=tokenized_dataset["train"],
-            data_collator=DataCollatorForSeq2Seq(tokenizer, model=model)
         )
         # Step 4: Start training
         trainer.train()
         # Step 5: Save the model
-        model.save_pretrained("train_llama.py")
-        tokenizer.save_pretrained("./train_llama.py")
-        return "Training completed successfully! Model saved to ./train_llama.py"
     except Exception as e:
         return f"Error: {str(e)}"
 # Gradio UI
 with gr.Blocks(title="Model Fine-Tuning Interface") as demo:
-    gr.Markdown("train_llama.py")
-    gr.Markdown("Upload a JSON file with 'input' and 'output' pairs to fine-tune the model on your fraud dataset.")
     file_input = gr.File(label="Upload Fraud Dataset (JSON)")
     train_button = gr.Button("Start Fine-Tuning")
@@ -83,5 +153,4 @@ with gr.Blocks(title="Model Fine-Tuning Interface") as demo:
     train_button.click(fn=train_ui_tars, inputs=file_input, outputs=output)
-# Launch the app
 demo.launch()

+# app.py
+# Handle missing dependencies first
+try:
+    import gradio as gr
+    from transformers import LlamaForCausalLM, LlamaTokenizer, Trainer, TrainingArguments
+    import datasets
+    import torch
+    import json
+    import os
+    from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training
+    from accelerate import Accelerator
+    import bitsandbytes
+except ImportError as e:
+    missing_package = str(e).split("'")[-2]  # Extract the missing package name
+    os.system(f'pip install "{missing_package}>=0.26.0" if "accelerate" in missing_package else f'pip install {missing_package}')
+    # Re-import after installation
+    import gradio as gr
+    from transformers import LlamaForCausalLM, LlamaTokenizer, Trainer, TrainingArguments
+    import datasets
+    import torch
+    import json
+    import os
+    from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training
+    from accelerate import Accelerator
+    import bitsandbytes
 # Model setup
+MODEL_ID = "meta-llama/Llama-2-7b-hf"  # Use Llama-2-7b; switch to "meta-llama/Llama-3-8b-hf" for Llama 3
+tokenizer = LlamaTokenizer.from_pretrained(MODEL_ID)
+# Add padding token if it doesn't exist (required for Llama models)
+if tokenizer.pad_token is None:
+    tokenizer.add_special_tokens({'pad_token': '[PAD]'})
+# Check if CUDA is available to enable Flash Attention 2
+use_flash_attention = torch.cuda.is_available() and torch.cuda.get_device_capability()[0] >= 8  # Ampere or newer (e.g., A100)
+# Load the model with optimizations for Llama
+model = LlamaForCausalLM.from_pretrained(
+    MODEL_ID,
+    torch_dtype=torch.bfloat16,  # Better for A100 GPUs, falls back to float16 on CPU
+    device_map="auto",
+    use_flash_attention_2=use_flash_attention,  # Only enable if GPU supports it
+    load_in_8bit=True  # Quantization for memory efficiency
+)
+# Prepare the model for training with LoRA (more memory-efficient)
+model = prepare_model_for_kbit_training(model)
+# LoRA configuration
+peft_config = LoraConfig(
+    r=16,               # Rank
+    lora_alpha=32,      # Alpha
+    lora_dropout=0.05,  # Dropout
+    bias="none",
+    task_type="CAUSAL_LM",
+    target_modules=["q_proj", "k_proj", "v_proj", "o_proj"]  # Attention modules for Llama
+)
+model = get_peft_model(model, peft_config)
+model.print_trainable_parameters()  # Print percentage of trainable parameters
 # Function to process uploaded JSON and train
 def train_ui_tars(file):
         # Load dataset
         dataset = datasets.load_dataset("json", data_files=fixed_json_path)
+        # Step 2: Tokenize dataset with Llama-compatible context length
         def tokenize_data(example):
+            # Format input for Llama (instruction-following style)
+            formatted_text = f"<s>[INST] {example['input']} [/INST] {example['output']}</s>"
+            inputs = tokenizer(
+                formatted_text,
+                padding="max_length",
+                truncation=True,
+                max_length=2048,  # Llama 2 context length; adjust to 8192 for Llama 3 if needed
+                return_tensors="pt"
+            )
+            inputs["labels"] = inputs["input_ids"].clone()
+            return {k: v.squeeze(0) for k, v in inputs.items()}
+        tokenized_dataset = dataset["train"].map(tokenize_data, batched=True, remove_columns=dataset["train"].column_names)
         # Step 3: Training setup
         training_args = TrainingArguments(
+            output_dir="./fine_tuned_llama",
+            per_device_train_batch_size=4,  # Increased for better efficiency
+            gradient_accumulation_steps=8,  # To handle larger effective batch size
             evaluation_strategy="no",
             save_strategy="epoch",
             save_total_limit=2,
             num_train_epochs=3,
             learning_rate=2e-5,
             weight_decay=0.01,
+            logging_dir="./logs",
+            logging_steps=10,
+            bf16=True,  # Use bfloat16 for A100 GPUs, falls back to float16 on CPU
+            gradient_checkpointing=True,  # Memory optimization
+            optim="adamw_torch",
+            warmup_steps=100,
         )
+        # Custom data collator for Llama
+        def custom_data_collator(features):
+            batch = {
+                "input_ids": torch.stack([f["input_ids"] for f in features]),
+                "attention_mask": torch.stack([f["attention_mask"] for f in features]),
+                "labels": torch.stack([f["labels"] for f in features]),
+            }
+            return batch
         trainer = Trainer(
             model=model,
             args=training_args,
+            train_dataset=tokenized_dataset,
+            data_collator=custom_data_collator,
         )
         # Step 4: Start training
         trainer.train()
         # Step 5: Save the model
+        model.save_pretrained("./fine_tuned_llama")
+        tokenizer.save_pretrained("./fine_tuned_llama")
+        return "Training completed successfully! Model saved to ./fine_tuned_llama"
     except Exception as e:
         return f"Error: {str(e)}"
 # Gradio UI
 with gr.Blocks(title="Model Fine-Tuning Interface") as demo:
+    gr.Markdown("# Llama Fraud Detection Fine-Tuning UI")
+    gr.Markdown("Upload a JSON file with 'input' and 'output' pairs to fine-tune the Llama model on your fraud dataset.")
     file_input = gr.File(label="Upload Fraud Dataset (JSON)")
     train_button = gr.Button("Start Fine-Tuning")
     train_button.click(fn=train_ui_tars, inputs=file_input, outputs=output)
 demo.launch()