Spaces:

a-ragab-h-m
/

vrp-shanghai-transformer

Sleeping

App Files Files Community

a-ragab-h-m commited on Jun 3

Commit

f75943a

verified ·

1 Parent(s): c389cb0

Create run.py

Browse files

Files changed (1) hide show

run.py +192 -0

run.py ADDED Viewed

	@@ -0,0 +1,192 @@

+import os
+import sys
+import torch
+import torch.nn as nn
+from datetime import datetime
+from torch.nn.utils import clip_grad_norm_
+import torch.optim as optim
+from torch.utils.data import DataLoader
+import json
+from nets.model import Model
+from Actor.actor import Actor
+from dataloader import VRP_Dataset
+from google_solver.google_model import evaluate_google_model
+# Load params
+with open('params.json', 'r') as f:
+    params = json.load(f)
+# Settings
+device = params['device']
+run_tests = params['run_tests']
+save_results = params['save_results']
+dataset_path = params['dataset_path']
+# Create results directory
+now = datetime.now()
+dt_string = now.strftime("%d-%m-%y %H-%M-%S")
+print('Current time: ' + dt_string + '\n')
+if save_results:
+    results_dir = 'results'
+    os.makedirs(results_dir, exist_ok=True)
+    experiment_path = os.path.join(results_dir, dt_string)
+    os.makedirs(experiment_path, exist_ok=True)
+    open(os.path.join(experiment_path, 'train_results.txt'), 'w').close()
+    open(os.path.join(experiment_path, 'test_results.txt'), 'w').close()
+    with open(os.path.join(experiment_path, 'params.json'), 'w') as f:
+        json.dump(params, f)
+    os.mkdir(os.path.join(experiment_path, 'problem_instances'))
+# Dataset sizes
+train_dataset_size = params['train_dataset_size']
+validation_dataset_size = params['validation_dataset_size']
+baseline_dataset_size = params['baseline_dataset_size']
+# Problem config
+num_nodes = params['num_nodes']
+num_depots = params['num_depots']
+embedding_size = params['embedding_size']
+sample_size = params['sample_size']
+gradient_clipping = params['gradient_clipping']
+num_neighbors_encoder = params['num_neighbors_encoder']
+num_neighbors_action = params['num_neighbors_action']
+num_movers = params['num_movers']
+learning_rate = params['learning_rate']
+batch_size = params['batch_size']
+test_batch_size = params['test_batch_size']
+baseline_update_period = params['baseline_update_period']
+# Datasets
+validation_dataset = VRP_Dataset(validation_dataset_size, num_nodes, num_depots, dataset_path, device)
+baseline_dataset = VRP_Dataset(train_dataset_size, num_nodes, num_depots, dataset_path, device)
+if params['overfit_test']:
+    train_dataset = VRP_Dataset(train_dataset_size, num_nodes, num_depots, dataset_path, device)
+    baseline_dataset = train_dataset
+    validation_dataset = train_dataset
+# Evaluate Google solver
+google_scores = evaluate_google_model(validation_dataset)
+tot_google_scores = google_scores.sum().item()
+input_size = validation_dataset.model_input_length()
+# Models
+model = Model(input_size=input_size, embedding_size=embedding_size)
+actor = Actor(model=model, num_movers=num_movers,
+              num_neighbors_encoder=num_neighbors_encoder,
+              num_neighbors_action=num_neighbors_action,
+              device=device, normalize=False)
+actor.train_mode()
+baseline_model = Model(input_size=input_size, embedding_size=embedding_size)
+baseline_actor = Actor(model=baseline_model, num_movers=num_movers,
+                        num_neighbors_encoder=num_neighbors_encoder,
+                        num_neighbors_action=num_neighbors_action,
+                        device=device, normalize=False)
+baseline_actor.greedy_search()
+baseline_actor.load_state_dict(actor.state_dict())
+nn_actor = Actor(model=None, num_movers=1, num_neighbors_action=1, device=device)
+nn_actor.nearest_neighbors()
+optimizer = optim.Adam(params=actor.parameters(), lr=learning_rate)
+train_batch_record = 100
+validation_record = 100
+baseline_record = None
+# Training loop
+for epoch in range(params['num_epochs']):
+    if not params['overfit_test']:
+        train_dataset = VRP_Dataset(train_dataset_size, num_nodes, num_depots, dataset_path, device)
+    train_dataloader = DataLoader(train_dataset, batch_size=batch_size, collate_fn=train_dataset.collate)
+    for i, batch in enumerate(train_dataloader):
+        with torch.no_grad():
+            nn_actor.nearest_neighbors()
+            nn_output = nn_actor(batch)
+            tot_nn_cost = nn_output['total_time'].sum().item()
+            baseline_actor.greedy_search()
+            baseline_cost = baseline_actor(batch)['total_time']
+        actor.train_mode()
+        actor_output = actor(batch)
+        actor_cost, log_probs = actor_output['total_time'], actor_output['log_probs']
+        loss = ((actor_cost - baseline_cost).detach() * log_probs).mean()
+        optimizer.zero_grad()
+        loss.backward()
+        if gradient_clipping:
+            for group in optimizer.param_groups:
+                clip_grad_norm_(group['params'], 1, norm_type=2)
+        optimizer.step()
+        tot_actor_cost = actor_cost.sum().item()
+        tot_baseline_cost = baseline_cost.sum().item()
+        actor_nn_ratio = tot_actor_cost / tot_nn_cost
+        actor_baseline_ratio = tot_actor_cost / tot_baseline_cost
+        train_batch_record = min(train_batch_record, actor_nn_ratio)
+        result = f"{epoch}, {i}, {actor_nn_ratio:.4f}, {actor_baseline_ratio:.4f}, {train_batch_record:.4f}"
+        print(result, flush=True)
+        if save_results:
+            with open(os.path.join(experiment_path, 'train_results.txt'), 'a') as f:
+                f.write(result + '\n')
+        del batch
+    # Validation
+    if epoch % 5 == 0:
+        baseline_dataloader = DataLoader(baseline_dataset, batch_size=batch_size, collate_fn=baseline_dataset.collate)
+        tot_cost = []
+        for batch in baseline_dataloader:
+            with torch.no_grad():
+                actor.greedy_search()
+                actor_output = actor(batch)
+                cost = actor_output['total_time']
+            tot_cost.append(cost)
+        del batch
+        tot_cost = torch.cat(tot_cost, dim=0)
+        if baseline_record is None or (tot_cost < baseline_record).float().mean().item() > 0.9:
+            baseline_record = tot_cost
+            baseline_actor.load_state_dict(actor.state_dict())
+            print('\nNew baseline record\n')
+    # Test every 10 epochs
+    if (epoch % 10 == 0) and run_tests:
+        b = max(int(batch_size // sample_size**2), 1)
+        validation_dataloader = DataLoader(validation_dataset, batch_size=b, collate_fn=validation_dataset.collate)
+        tot_cost = 0
+        tot_nn_cost = 0
+        for batch in validation_dataloader:
+            with torch.no_grad():
+                actor.beam_search(sample_size)
+                actor_output = actor(batch)
+                cost = actor_output['total_time']
+                nn_actor.nearest_neighbors()
+                nn_output = nn_actor(batch)
+                nn_cost = nn_output['total_time']
+            tot_cost += cost.sum().item()
+            tot_nn_cost += nn_cost.sum().item()
+        ratio = tot_cost / tot_nn_cost
+        validation_record = min(validation_record, ratio)
+        if save_results:
+            torch.save(actor.state_dict(), os.path.join(experiment_path, 'model_state_dict.pt'))
+            torch.save(optimizer.state_dict(), os.path.join(experiment_path, 'optimizer_state_dict.pt'))
+        actor_google_ratio = tot_cost / tot_google_scores
+        print(f"\nTest results:\nActor/Google: {actor_google_ratio:.4f}, Actor/NN: {ratio:.4f}, Best NN Ratio: {validation_record:.4f}\n")
+        if save_results:
+            with open(os.path.join(experiment_path, 'test_results.txt'), 'a') as f:
+                f.write(f"{epoch}, {actor_google_ratio:.4f}, {ratio:.4f}, {validation_record:.4f}\n")