Spaces:

unit731
/

cyber_llm

Running

App Files Files Community

cyber_llm / src /learning /transfer_learning.py

unit731

Upload core Cyber-LLM platform components

23804b3 verified 7 days ago

raw

history blame contribute delete

29 kB

	"""
	Advanced Transfer Learning System for Cybersecurity AI
	Implements domain adaptation, multi-task learning, and knowledge transfer capabilities
	"""

	import torch
	import torch.nn as nn
	import torch.nn.functional as F
	import numpy as np
	import json
	import os
	from typing import Dict, List, Optional, Any, Union, Tuple
	from dataclasses import dataclass, asdict
	from datetime import datetime
	import logging
	from abc import ABC, abstractmethod
	from collections import defaultdict

	@dataclass
	class TransferLearningConfig:
	"""Configuration for transfer learning setup"""
	source_domain: str
	target_domain: str
	transfer_method: str
	freeze_layers: List[str]
	adaptation_layers: List[str]
	learning_rates: Dict[str, float]
	loss_weights: Dict[str, float]

	@dataclass
	class DomainAdaptationResult:
	"""Results from domain adaptation"""
	source_loss: float
	target_loss: float
	domain_loss: float
	adaptation_score: float
	transfer_effectiveness: float

	class FeatureExtractor(nn.Module):
	"""Base feature extractor for transfer learning"""

	def __init__(self, input_size: int, hidden_sizes: List[int], output_size: int):
	super().__init__()

	layers = []
	prev_size = input_size

	for hidden_size in hidden_sizes:
	layers.extend([
	nn.Linear(prev_size, hidden_size),
	nn.BatchNorm1d(hidden_size),
	nn.ReLU(),
	nn.Dropout(0.3)
	])
	prev_size = hidden_size

	layers.append(nn.Linear(prev_size, output_size))

	self.network = nn.Sequential(*layers)

	def forward(self, x):
	return self.network(x)

	class DomainClassifier(nn.Module):
	"""Domain classifier for adversarial domain adaptation"""

	def __init__(self, feature_size: int, hidden_size: int = 128):
	super().__init__()
	self.classifier = nn.Sequential(
	nn.Linear(feature_size, hidden_size),
	nn.ReLU(),
	nn.Dropout(0.5),
	nn.Linear(hidden_size, hidden_size // 2),
	nn.ReLU(),
	nn.Dropout(0.5),
	nn.Linear(hidden_size // 2, 2) # Binary: source vs target domain
	)

	def forward(self, x):
	return self.classifier(x)

	class TaskClassifier(nn.Module):
	"""Task-specific classifier"""

	def __init__(self, feature_size: int, num_classes: int, hidden_size: int = 128):
	super().__init__()
	self.classifier = nn.Sequential(
	nn.Linear(feature_size, hidden_size),
	nn.ReLU(),
	nn.Dropout(0.3),
	nn.Linear(hidden_size, num_classes)
	)

	def forward(self, x):
	return self.classifier(x)

	class GradientReversalLayer(torch.autograd.Function):
	"""Gradient reversal layer for adversarial training"""

	@staticmethod
	def forward(ctx, x, alpha):
	ctx.alpha = alpha
	return x.view_as(x)

	@staticmethod
	def backward(ctx, grad_output):
	return grad_output.neg() * ctx.alpha, None

	class TransferLearningModel(nn.Module):
	"""Multi-purpose transfer learning model for cybersecurity tasks"""

	def __init__(self, config: Dict[str, Any]):
	super().__init__()

	self.config = config
	self.feature_size = config.get('feature_size', 256)

	# Feature extractor (shared across domains/tasks)
	self.feature_extractor = FeatureExtractor(
	input_size=config['input_size'],
	hidden_sizes=config.get('hidden_sizes', [512, 256]),
	output_size=self.feature_size
	)

	# Task-specific classifiers
	self.task_classifiers = nn.ModuleDict()
	for task_name, num_classes in config.get('tasks', {}).items():
	self.task_classifiers[task_name] = TaskClassifier(
	self.feature_size, num_classes
	)

	# Domain classifier for domain adaptation
	self.domain_classifier = DomainClassifier(self.feature_size)

	# Layer freezing setup
	self.frozen_layers = set(config.get('frozen_layers', []))

	def forward(self, x, task_name: str = None, alpha: float = 0.0):
	# Extract features
	features = self.feature_extractor(x)

	results = {}

	# Task classification
	if task_name and task_name in self.task_classifiers:
	results['task_output'] = self.task_classifiers[task_name](features)

	# Domain classification (with gradient reversal)
	if alpha > 0:
	reversed_features = GradientReversalLayer.apply(features, alpha)
	results['domain_output'] = self.domain_classifier(reversed_features)

	results['features'] = features
	return results

	def freeze_layers(self, layer_names: List[str]):
	"""Freeze specified layers"""
	for name, param in self.named_parameters():
	if any(layer_name in name for layer_name in layer_names):
	param.requires_grad = False
	self.frozen_layers.add(name)

	def unfreeze_layers(self, layer_names: List[str]):
	"""Unfreeze specified layers"""
	for name, param in self.named_parameters():
	if any(layer_name in name for layer_name in layer_names):
	param.requires_grad = True
	self.frozen_layers.discard(name)

	class CyberTransferLearning:
	"""Advanced transfer learning system for cybersecurity applications"""

	def __init__(self, config_path: str = None):
	self.config = self._load_config(config_path)
	self.models = {}
	self.transfer_history = []
	self.logger = logging.getLogger(__name__)

	# Cybersecurity domain mappings
	self.domain_mappings = {
	'malware_detection': {
	'features': ['file_size', 'entropy', 'api_calls', 'strings'],
	'related_domains': ['threat_detection', 'anomaly_detection']
	},
	'network_intrusion': {
	'features': ['packet_size', 'flow_duration', 'protocol', 'ports'],
	'related_domains': ['anomaly_detection', 'traffic_analysis']
	},
	'phishing_detection': {
	'features': ['url_features', 'content_features', 'metadata'],
	'related_domains': ['malware_detection', 'fraud_detection']
	},
	'vulnerability_assessment': {
	'features': ['code_metrics', 'dependencies', 'patterns'],
	'related_domains': ['malware_detection', 'threat_detection']
	},
	'threat_intelligence': {
	'features': ['iocs', 'ttps', 'attribution', 'context'],
	'related_domains': ['malware_detection', 'network_intrusion']
	}
	}

	def _load_config(self, config_path: str) -> Dict[str, Any]:
	"""Load transfer learning configuration"""
	if config_path and os.path.exists(config_path):
	with open(config_path, 'r') as f:
	return json.load(f)

	# Default configuration
	return {
	'model_configs': {
	'malware_detection': {
	'input_size': 1024,
	'hidden_sizes': [512, 256],
	'tasks': {'malware_classification': 10, 'family_detection': 20}
	},
	'network_intrusion': {
	'input_size': 128,
	'hidden_sizes': [256, 128],
	'tasks': {'intrusion_detection': 2, 'attack_type': 15}
	}
	},
	'transfer_strategies': {
	'fine_tuning': {'freeze_ratio': 0.5, 'learning_rate_ratio': 0.1},
	'domain_adaptation': {'alpha_schedule': 'progressive', 'max_alpha': 1.0},
	'multi_task': {'task_weights': 'adaptive', 'sharing_layers': ['feature_extractor']}
	}
	}

	def create_transfer_model(self, source_domain: str, target_domain: str,
	transfer_method: str = 'fine_tuning') -> str:
	"""Create a transfer learning model"""
	model_id = f"transfer_{source_domain}_to_{target_domain}_{transfer_method}"

	# Get model configuration
	if target_domain in self.config['model_configs']:
	model_config = self.config['model_configs'][target_domain].copy()
	else:
	# Use source domain config as base
	model_config = self.config['model_configs'].get(
	source_domain, self.config['model_configs']['malware_detection']
	).copy()

	# Create model
	model = TransferLearningModel(model_config)

	# Load pre-trained source model if available
	source_model_path = f"/models/{source_domain}_pretrained.pth"
	if os.path.exists(source_model_path):
	self._load_pretrained_weights(model, source_model_path, source_domain, target_domain)

	# Apply transfer learning strategy
	if transfer_method == 'fine_tuning':
	self._setup_fine_tuning(model, source_domain, target_domain)
	elif transfer_method == 'domain_adaptation':
	self._setup_domain_adaptation(model, source_domain, target_domain)
	elif transfer_method == 'multi_task':
	self._setup_multi_task_learning(model, source_domain, target_domain)

	self.models[model_id] = {
	'model': model,
	'source_domain': source_domain,
	'target_domain': target_domain,
	'transfer_method': transfer_method,
	'created_at': datetime.now().isoformat()
	}

	self.logger.info(f"Created transfer model: {model_id}")
	return model_id

	def _load_pretrained_weights(self, model: TransferLearningModel,
	source_path: str, source_domain: str, target_domain: str):
	"""Load pre-trained weights with domain adaptation"""
	try:
	if os.path.exists(source_path):
	checkpoint = torch.load(source_path, map_location='cpu')

	# Load compatible weights
	model_dict = model.state_dict()
	pretrained_dict = {
	k: v for k, v in checkpoint.items()
	if k in model_dict and v.size() == model_dict[k].size()
	}

	model_dict.update(pretrained_dict)
	model.load_state_dict(model_dict)

	self.logger.info(f"Loaded {len(pretrained_dict)} pre-trained layers")
	else:
	self.logger.warning(f"Pre-trained model not found: {source_path}")
	except Exception as e:
	self.logger.error(f"Error loading pre-trained weights: {e}")

	def _setup_fine_tuning(self, model: TransferLearningModel,
	source_domain: str, target_domain: str):
	"""Setup fine-tuning strategy"""
	strategy = self.config['transfer_strategies']['fine_tuning']

	# Freeze lower layers
	all_params = list(model.named_parameters())
	freeze_count = int(len(all_params) * strategy['freeze_ratio'])

	freeze_layers = []
	for i, (name, param) in enumerate(all_params):
	if i < freeze_count:
	freeze_layers.append(name.split('.')[0])

	model.freeze_layers(freeze_layers)

	def _setup_domain_adaptation(self, model: TransferLearningModel,
	source_domain: str, target_domain: str):
	"""Setup domain adaptation strategy"""
	# Domain adaptation typically doesn't freeze layers initially
	# but uses adversarial training instead
	pass

	def _setup_multi_task_learning(self, model: TransferLearningModel,
	source_domain: str, target_domain: str):
	"""Setup multi-task learning strategy"""
	# Multi-task learning keeps all layers unfrozen
	# and learns multiple tasks simultaneously
	pass

	def adapt_domain(self, model_id: str, source_data: torch.Tensor,
	target_data: torch.Tensor, source_labels: torch.Tensor,
	target_labels: torch.Tensor = None,
	epochs: int = 50) -> DomainAdaptationResult:
	"""Perform domain adaptation training"""
	if model_id not in self.models:
	raise ValueError(f"Model {model_id} not found")

	model = self.models[model_id]['model']
	model.train()

	# Optimizers
	feature_optimizer = torch.optim.Adam(
	model.feature_extractor.parameters(), lr=1e-4
	)
	task_optimizer = torch.optim.Adam(
	model.task_classifiers.parameters(), lr=1e-4
	)
	domain_optimizer = torch.optim.Adam(
	model.domain_classifier.parameters(), lr=1e-3
	)

	# Loss functions
	task_criterion = nn.CrossEntropyLoss()
	domain_criterion = nn.CrossEntropyLoss()

	# Training metrics
	results = {
	'source_losses': [],
	'target_losses': [],
	'domain_losses': [],
	'adaptation_scores': []
	}

	for epoch in range(epochs):
	epoch_source_loss = 0.0
	epoch_target_loss = 0.0
	epoch_domain_loss = 0.0

	# Progressive alpha schedule for gradient reversal
	alpha = min(1.0, 2.0 / (1.0 + np.exp(-10 * epoch / epochs)) - 1.0)

	# Batch training
	batch_size = 32
	n_batches = max(len(source_data) // batch_size, len(target_data) // batch_size)

	for batch_idx in range(n_batches):
	# Get batches
	source_start = (batch_idx * batch_size) % len(source_data)
	target_start = (batch_idx * batch_size) % len(target_data)

	source_batch = source_data[source_start:source_start + batch_size]
	source_label_batch = source_labels[source_start:source_start + batch_size]
	target_batch = target_data[target_start:target_start + batch_size]

	# Create domain labels
	source_domain_labels = torch.zeros(len(source_batch), dtype=torch.long)
	target_domain_labels = torch.ones(len(target_batch), dtype=torch.long)

	# Forward pass - source data
	source_results = model(source_batch, task_name='task_classification', alpha=alpha)

	# Task loss on source data
	if 'task_classification' in model.task_classifiers:
	task_loss = task_criterion(
	source_results['task_output'], source_label_batch
	)
	else:
	# Use first available task
	first_task = next(iter(model.task_classifiers.keys()))
	source_results = model(source_batch, task_name=first_task, alpha=alpha)
	task_loss = task_criterion(
	source_results['task_output'], source_label_batch
	)

	# Domain loss on both source and target
	combined_features = torch.cat([
	source_results['features'],
	model(target_batch, alpha=alpha)['features']
	])
	combined_domain_labels = torch.cat([
	source_domain_labels, target_domain_labels
	])

	reversed_features = GradientReversalLayer.apply(combined_features, alpha)
	domain_output = model.domain_classifier(reversed_features)
	domain_loss = domain_criterion(domain_output, combined_domain_labels)

	# Backward pass
	feature_optimizer.zero_grad()
	task_optimizer.zero_grad()
	domain_optimizer.zero_grad()

	total_loss = task_loss + domain_loss
	total_loss.backward()

	feature_optimizer.step()
	task_optimizer.step()
	domain_optimizer.step()

	epoch_source_loss += task_loss.item()
	epoch_domain_loss += domain_loss.item()

	# Target loss (if target labels available)
	if target_labels is not None:
	target_start_label = (batch_idx * batch_size) % len(target_labels)
	target_label_batch = target_labels[target_start_label:target_start_label + batch_size]

	target_results = model(target_batch, task_name=first_task)
	target_loss = task_criterion(
	target_results['task_output'], target_label_batch
	)
	epoch_target_loss += target_loss.item()

	# Record epoch metrics
	avg_source_loss = epoch_source_loss / n_batches
	avg_target_loss = epoch_target_loss / n_batches if target_labels is not None else 0.0
	avg_domain_loss = epoch_domain_loss / n_batches

	results['source_losses'].append(avg_source_loss)
	results['target_losses'].append(avg_target_loss)
	results['domain_losses'].append(avg_domain_loss)

	# Calculate adaptation score (domain confusion)
	adaptation_score = 1.0 - (avg_domain_loss / np.log(2)) # Normalized by random chance
	results['adaptation_scores'].append(adaptation_score)

	if epoch % 10 == 0:
	self.logger.info(
	f"Epoch {epoch}: Source Loss {avg_source_loss:.4f}, "
	f"Domain Loss {avg_domain_loss:.4f}, "
	f"Adaptation Score {adaptation_score:.4f}"
	)

	# Calculate final results
	final_result = DomainAdaptationResult(
	source_loss=np.mean(results['source_losses'][-5:]),
	target_loss=np.mean(results['target_losses'][-5:]) if results['target_losses'] else 0.0,
	domain_loss=np.mean(results['domain_losses'][-5:]),
	adaptation_score=np.mean(results['adaptation_scores'][-5:]),
	transfer_effectiveness=self._calculate_transfer_effectiveness(results)
	)

	# Store adaptation history
	self.transfer_history.append({
	'model_id': model_id,
	'adaptation_result': asdict(final_result),
	'training_curves': results,
	'timestamp': datetime.now().isoformat()
	})

	return final_result

	def _calculate_transfer_effectiveness(self, results: Dict[str, List[float]]) -> float:
	"""Calculate transfer learning effectiveness score"""
	if not results['source_losses']:
	return 0.0

	# Measure improvement over training
	initial_loss = np.mean(results['source_losses'][:5])
	final_loss = np.mean(results['source_losses'][-5:])

	# Measure domain adaptation quality
	final_adaptation = np.mean(results['adaptation_scores'][-5:])

	# Combine metrics (higher is better)
	improvement_ratio = max(0, (initial_loss - final_loss) / initial_loss)
	effectiveness = (improvement_ratio + final_adaptation) / 2.0

	return min(1.0, max(0.0, effectiveness))

	def get_transfer_recommendations(self, target_domain: str,
	available_domains: List[str] = None) -> List[Dict[str, Any]]:
	"""Get recommendations for transfer learning sources"""
	if available_domains is None:
	available_domains = list(self.domain_mappings.keys())

	recommendations = []

	if target_domain not in self.domain_mappings:
	return recommendations

	target_info = self.domain_mappings[target_domain]

	for source_domain in available_domains:
	if source_domain == target_domain:
	continue

	if source_domain not in self.domain_mappings:
	continue

	source_info = self.domain_mappings[source_domain]

	# Calculate similarity score
	feature_overlap = len(
	set(target_info['features']) & set(source_info['features'])
	) / len(set(target_info['features']) \| set(source_info['features']))

	domain_relatedness = 1.0 if source_domain in target_info['related_domains'] else 0.5

	similarity_score = (feature_overlap + domain_relatedness) / 2.0

	# Recommend transfer method based on similarity
	if similarity_score > 0.7:
	recommended_method = 'fine_tuning'
	expected_improvement = '20-40%'
	elif similarity_score > 0.4:
	recommended_method = 'domain_adaptation'
	expected_improvement = '10-25%'
	else:
	recommended_method = 'multi_task'
	expected_improvement = '5-15%'

	recommendations.append({
	'source_domain': source_domain,
	'similarity_score': similarity_score,
	'recommended_method': recommended_method,
	'expected_improvement': expected_improvement,
	'feature_overlap': feature_overlap,
	'domain_relatedness': domain_relatedness
	})

	# Sort by similarity score
	recommendations.sort(key=lambda x: x['similarity_score'], reverse=True)

	return recommendations

	def evaluate_transfer_performance(self, model_id: str, test_data: torch.Tensor,
	test_labels: torch.Tensor, task_name: str = None) -> Dict[str, float]:
	"""Evaluate transfer learning model performance"""
	if model_id not in self.models:
	raise ValueError(f"Model {model_id} not found")

	model = self.models[model_id]['model']
	model.eval()

	metrics = {}

	with torch.no_grad():
	# Get predictions
	if task_name is None:
	task_name = next(iter(model.task_classifiers.keys()))

	results = model(test_data, task_name=task_name)
	predictions = torch.argmax(results['task_output'], dim=1)

	# Calculate metrics
	accuracy = (predictions == test_labels).float().mean().item()

	# Convert to numpy for sklearn metrics
	predictions_np = predictions.cpu().numpy()
	labels_np = test_labels.cpu().numpy()

	# Calculate additional metrics
	from sklearn.metrics import precision_score, recall_score, f1_score, classification_report

	precision = precision_score(labels_np, predictions_np, average='weighted', zero_division=0)
	recall = recall_score(labels_np, predictions_np, average='weighted', zero_division=0)
	f1 = f1_score(labels_np, predictions_np, average='weighted', zero_division=0)

	metrics = {
	'accuracy': accuracy,
	'precision': precision,
	'recall': recall,
	'f1_score': f1,
	'num_samples': len(test_labels)
	}

	return metrics

	def save_model(self, model_id: str, path: str):
	"""Save transfer learning model"""
	if model_id not in self.models:
	raise ValueError(f"Model {model_id} not found")

	model_info = self.models[model_id]

	checkpoint = {
	'model_state_dict': model_info['model'].state_dict(),
	'model_config': model_info,
	'transfer_history': [
	h for h in self.transfer_history if h['model_id'] == model_id
	]
	}

	os.makedirs(os.path.dirname(path), exist_ok=True)
	torch.save(checkpoint, path)
	self.logger.info(f"Saved transfer model to {path}")

	def get_transfer_summary(self) -> Dict[str, Any]:
	"""Get summary of transfer learning activities"""
	summary = {
	'total_models': len(self.models),
	'transfer_methods_used': set(),
	'domain_pairs': set(),
	'average_effectiveness': 0.0,
	'successful_transfers': 0,
	'generated_at': datetime.now().isoformat()
	}

	effectiveness_scores = []

	for model_id, model_info in self.models.items():
	summary['transfer_methods_used'].add(model_info['transfer_method'])
	summary['domain_pairs'].add(
	f"{model_info['source_domain']} → {model_info['target_domain']}"
	)

	# Find effectiveness scores from history
	for history in self.transfer_history:
	if history['model_id'] == model_id:
	effectiveness = history['adaptation_result'].get('transfer_effectiveness', 0.0)
	effectiveness_scores.append(effectiveness)
	if effectiveness > 0.3: # Threshold for success
	summary['successful_transfers'] += 1

	if effectiveness_scores:
	summary['average_effectiveness'] = np.mean(effectiveness_scores)

	# Convert sets to lists for JSON serialization
	summary['transfer_methods_used'] = list(summary['transfer_methods_used'])
	summary['domain_pairs'] = list(summary['domain_pairs'])

	return summary

	# Example usage and testing
	if __name__ == "__main__":
	print("🔄 Transfer Learning System Testing:")
	print("=" * 50)

	# Initialize transfer learning system
	transfer_system = CyberTransferLearning()

	# Get transfer recommendations
	print("\n📋 Transfer Learning Recommendations:")
	recommendations = transfer_system.get_transfer_recommendations('phishing_detection')
	for rec in recommendations[:3]:
	print(f" Source: {rec['source_domain']}")
	print(f" Similarity: {rec['similarity_score']:.3f}")
	print(f" Method: {rec['recommended_method']}")
	print(f" Expected Improvement: {rec['expected_improvement']}")
	print()

	# Create transfer models
	print("🏗️ Creating transfer models...")
	model_id = transfer_system.create_transfer_model(
	'malware_detection',
	'phishing_detection',
	'domain_adaptation'
	)

	# Generate synthetic data for testing
	print("\n🧪 Testing with synthetic data...")
	source_data = torch.randn(1000, 1024)
	source_labels = torch.randint(0, 10, (1000,))
	target_data = torch.randn(500, 1024)
	target_labels = torch.randint(0, 10, (500,))

	# Perform domain adaptation
	print("🎯 Performing domain adaptation...")
	adaptation_result = transfer_system.adapt_domain(
	model_id, source_data, target_data, source_labels, target_labels, epochs=20
	)

	print(f" Source Loss: {adaptation_result.source_loss:.4f}")
	print(f" Domain Loss: {adaptation_result.domain_loss:.4f}")
	print(f" Adaptation Score: {adaptation_result.adaptation_score:.4f}")
	print(f" Transfer Effectiveness: {adaptation_result.transfer_effectiveness:.4f}")

	# Evaluate performance
	print("\n📊 Evaluating model performance...")
	test_data = torch.randn(200, 1024)
	test_labels = torch.randint(0, 10, (200,))

	performance = transfer_system.evaluate_transfer_performance(
	model_id, test_data, test_labels
	)

	print(f" Accuracy: {performance['accuracy']:.3f}")
	print(f" F1 Score: {performance['f1_score']:.3f}")
	print(f" Precision: {performance['precision']:.3f}")
	print(f" Recall: {performance['recall']:.3f}")

	# Get transfer summary
	print("\n📈 Transfer Learning Summary:")
	summary = transfer_system.get_transfer_summary()
	print(f" Total Models: {summary['total_models']}")
	print(f" Successful Transfers: {summary['successful_transfers']}")
	print(f" Average Effectiveness: {summary['average_effectiveness']:.3f}")
	print(f" Methods Used: {', '.join(summary['transfer_methods_used'])}")

	print("\n✅ Transfer Learning System implemented and tested")