Spaces:

Avinash109
/

BN

Sleeping

App Files Files Community

Avinash109 commited on Sep 23, 2024

Commit

8448555

verified ·

1 Parent(s): 49cea6e

Update app.py

Browse files

Files changed (1) hide show

app.py +121 -245

app.py CHANGED Viewed

@@ -4,276 +4,152 @@ import torch
 import torch.nn as nn
 import torch.optim as optim
 from torch.utils.data import Dataset, DataLoader
-from sklearn.model_selection import train_test_split
 from sklearn.preprocessing import StandardScaler
-import joblib
 import gradio as gr
-from apscheduler.schedulers.background import BackgroundScheduler
-from torch.optim.lr_scheduler import ReduceLROnPlateau
-from torch.nn import TransformerEncoder, TransformerEncoderLayer
-import optuna
-from sklearn.metrics import mean_squared_error
-import matplotlib.pyplot as plt
-import seaborn as sns
-import logging
-# Set up logging
-logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
-# Load and preprocess data
-try:
-    data = pd.read_csv('BANKNIFTY_OPTION_CHAIN_data.csv')
-    scaler = StandardScaler()
-    scaled_data = scaler.fit_transform(data[['open', 'high', 'low', 'close', 'volume', 'oi']])
-    data[['open', 'high', 'low', 'close', 'volume', 'oi']] = scaled_data
-    joblib.dump(scaler, 'scaler.gz')
-    logging.info(f"Data loaded and preprocessed. Total data points: {len(data)}")
-except Exception as e:
-    logging.error(f"Error in data loading and preprocessing: {str(e)}")
-    raise
 class BankNiftyDataset(Dataset):
-    def __init__(self, data, seq_len, expiry_type, target_cols=['close']):
         self.data = data
         self.seq_len = seq_len
-        self.expiry_type = expiry_type
         self.target_cols = target_cols
-        if self.expiry_type == "weekly":
-            self.filtered_data = data[data['Expiry'].str.contains("W")]
-        elif self.expiry_type == "monthly":
-            self.filtered_data = data[~data['Expiry'].str.contains("W")]
-        else:
-            self.filtered_data = data
-        if len(self.filtered_data) < self.seq_len:
-            raise ValueError(f"Not enough data points for the specified sequence length. "
-                             f"Got {len(self.filtered_data)} data points, need at least {self.seq_len}.")
-        logging.info(f"{expiry_type.capitalize()} dataset created with {len(self.filtered_data)} data points")
     def __len__(self):
-        return max(0, len(self.filtered_data) - self.seq_len + 1)
     def __getitem__(self, idx):
-        if idx < 0 or idx >= len(self):
-            raise IndexError("Index out of range")
-        seq_data = self.filtered_data.iloc[idx:idx+self.seq_len]
         features = torch.tensor(seq_data[['open', 'high', 'low', 'close', 'volume', 'oi']].values, dtype=torch.float32)
         label = torch.tensor(seq_data[self.target_cols].iloc[-1].values, dtype=torch.float32)
         return features, label
-class AdvancedModel(nn.Module):
-    def __init__(self, input_dim, hidden_dim, output_dim, num_layers=2, nhead=4, dropout=0.1):
-        super(AdvancedModel, self).__init__()
         self.lstm = nn.LSTM(input_dim, hidden_dim, num_layers=num_layers, batch_first=True, dropout=dropout)
-        self.gru = nn.GRU(input_dim, hidden_dim, num_layers=num_layers, batch_first=True, dropout=dropout)
-        transformer_dim = (input_dim // nhead) * nhead
-        self.input_proj = nn.Linear(input_dim, transformer_dim) if input_dim != transformer_dim else nn.Identity()
-        encoder_layers = TransformerEncoderLayer(d_model=transformer_dim, nhead=nhead, dim_feedforward=hidden_dim, dropout=dropout)
-        self.transformer = TransformerEncoder(encoder_layers, num_layers=num_layers)
-        self.attention = nn.MultiheadAttention(hidden_dim, num_heads=nhead, dropout=dropout)
         self.fc = nn.Sequential(
-            nn.Linear(hidden_dim * 3, hidden_dim),
             nn.ReLU(),
             nn.Dropout(dropout),
-            nn.Linear(hidden_dim, output_dim)
         )
     def forward(self, x):
         lstm_out, _ = self.lstm(x)
-        gru_out, _ = self.gru(x)
-        transformer_input = self.input_proj(x)
-        transformer_out = self.transformer(transformer_input.transpose(0, 1)).transpose(0, 1)
-        combined = torch.cat((lstm_out[:, -1, :], gru_out[:, -1, :], transformer_out[:, -1, :]), dim=1)
-        out = self.fc(combined)
         return out
-def objective(trial):
-    try:
-        input_dim = 6
-        hidden_dim = trial.suggest_int("hidden_dim", 64, 256)
-        output_dim = len(target_cols)
-        num_layers = trial.suggest_int("num_layers", 1, 4)
-        max_nhead = min(8, hidden_dim // 8)
-        nhead = trial.suggest_int("nhead", 2, max_nhead)
-        hidden_dim = (hidden_dim // nhead) * nhead
-        dropout = trial.suggest_float("dropout", 0.1, 0.5)
-        lr = trial.suggest_loguniform("lr", 1e-5, 1e-2)
-        model = AdvancedModel(input_dim, hidden_dim, output_dim, num_layers, nhead, dropout)
-        optimizer = optim.Adam(model.parameters(), lr=lr)
-        criterion = nn.MSELoss()
-        train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
-        val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)
-        for epoch in range(10):
-            train_model(model, optimizer, criterion, train_loader)
-            val_loss = evaluate_model(model, criterion, val_loader)
-        return val_loss
-    except Exception as e:
-        logging.error(f"Error in objective function: {str(e)}")
-        return float('inf')
-def train_model(model, optimizer, criterion, train_loader):
-    model.train()
-    for batch in train_loader:
-        features, label = batch
-        optimizer.zero_grad()
-        output = model(features)
-        loss = criterion(output, label)
-        loss.backward()
-        optimizer.step()
-def evaluate_model(model, criterion, val_loader):
-    model.eval()
-    total_loss = 0
-    with torch.no_grad():
-        for batch in val_loader:
-            features, label = batch
-            output = model(features)
-            loss = criterion(output, label)
-            total_loss += loss.item()
-    return total_loss / len(val_loader)
-def generate_strategy(model, expiry_type):
     model.eval()
-    dataset = BankNiftyDataset(data, seq_len, expiry_type, target_cols)
-    loader = DataLoader(dataset, batch_size=1, shuffle=False)
     with torch.no_grad():
-        predictions = []
-        for features, _ in loader:
-            output = model(features)
-            predictions.append(output.squeeze().tolist())
-    return predictions
-def retrain_model():
-    try:
-        new_data = pd.read_csv('BANKNIFTY_OPTION_CHAIN_data.csv')
-        new_scaled_data = scaler.transform(new_data[['open', 'high', 'low', 'close', 'volume', 'oi']])
-        new_data[['open', 'high', 'low', 'close', 'volume', 'oi']] = new_scaled_data
-        new_train_data, new_val_data = train_test_split(new_data, test_size=0.2, random_state=42)
-        new_train_dataset = BankNiftyDataset(new_train_data, seq_len, "weekly", target_cols)
-        new_val_dataset = BankNiftyDataset(new_val_data, seq_len, "weekly", target_cols)
-        new_train_loader = DataLoader(new_train_dataset, batch_size=32, shuffle=True)
-        new_val_loader = DataLoader(new_val_dataset, batch_size=32, shuffle=False)
-        train_model(model, optimizer, criterion, new_train_loader)
-        val_loss = evaluate_model(model, criterion, new_val_loader)
-        logging.info(f'Validation Loss after retraining: {val_loss:.4f}')
-        torch.save(model.state_dict(), 'retrained_model.pth')
-    except Exception as e:
-        logging.error(f"Error in retraining model: {str(e)}")
-def plot_predictions(predictions, actual_values, title):
-    plt.figure(figsize=(12, 6))
-    plt.plot(predictions, label='Predictions')
-    plt.plot(actual_values, label='Actual Values')
-    plt.title(title)
-    plt.xlabel('Time')
-    plt.ylabel('Value')
-    plt.legend()
-    return plt
-def display_strategies():
-    try:
-        weekly_predictions = generate_strategy(model, "weekly")
-        monthly_predictions = generate_strategy(model, "monthly")
-        weekly_actual = data[data['Expiry'].str.contains("W")][target_cols].values[-len(weekly_predictions):]
-        monthly_actual = data[~data['Expiry'].str.contains("W")][target_cols].values[-len(monthly_predictions):]
-        weekly_plot = plot_predictions(weekly_predictions, weekly_actual, "Weekly Expiry Predictions vs Actual")
-        monthly_plot = plot_predictions(monthly_predictions, monthly_actual, "Monthly Expiry Predictions vs Actual")
-        weekly_mse = mean_squared_error(weekly_actual, weekly_predictions)
-        monthly_mse = mean_squared_error(monthly_actual, monthly_predictions)
-        return (
-            f"Weekly Expiry Strategy Predictions (MSE: {weekly_mse:.4f}):\n{weekly_predictions}\n\n"
-            f"Monthly Expiry Strategy Predictions (MSE: {monthly_mse:.4f}):\n{monthly_predictions}",
-            weekly_plot,
-            monthly_plot
-        )
-    except Exception as e:
-        logging.error(f"Error in displaying strategies: {str(e)}")
-        return "An error occurred while generating strategies.", None, None
-# Main execution
-if __name__ == "__main__":
-    try:
-        target_cols = ['close', 'volume', 'oi']
-        seq_len = 20
-        logging.info(f"Total data points: {len(data)}")
-        logging.info(f"Weekly data points: {len(data[data['Expiry'].str.contains('W')])}")
-        logging.info(f"Monthly data points: {len(data[~data['Expiry'].str.contains('W')])}")
-        train_data, val_data = train_test_split(data, test_size=0.2, random_state=42)
-        logging.info(f"Train data points: {len(train_data)}")
-        logging.info(f"Validation data points: {len(val_data)}")
-        train_dataset = BankNiftyDataset(train_data, seq_len, "weekly", target_cols)
-        val_dataset = BankNiftyDataset(val_data, seq_len, "weekly", target_cols)
-        study = optuna.create_study(direction="minimize")
-        study.optimize(objective, n_trials=50)
-        best_params = study.best_params
-        logging.info(f"Best hyperparameters: {best_params}")
-        input_dim = 6
-        output_dim = len(target_cols)
-        model = AdvancedModel(input_dim, best_params['hidden_dim'], output_dim, best_params['num_layers'], best_params['nhead'], best_params['dropout'])
-        optimizer = optim.Adam(model.parameters(), lr=best_params['lr'])
-        criterion = nn.MSELoss()
-        scheduler = ReduceLROnPlateau(optimizer, mode='min', factor=0.5, patience=5, verbose=True)
-        num_epochs = 100
-        train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
-        val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)
-        for epoch in range(num_epochs):
-            train_model(model, optimizer, criterion, train_loader)
-            val_loss = evaluate_model(model, criterion, val_loader)
-            scheduler.step(val_loss)
-            logging.info(f"Epoch {epoch+1}/{num_epochs}, Validation Loss: {val_loss:.4f}")
-        torch.save(model.state_dict(), 'final_model.pth')
-        retraining_scheduler = BackgroundScheduler()
-        retraining_scheduler.add_job(retrain_model, 'interval', hours=1)
-        retraining_scheduler.start()
-        iface = gr.Interface(
-            fn=display_strategies,
-            inputs=None,
-            outputs=[
-                gr.Textbox(label="Strategy Predictions"),
-                gr.Plot(label="Weekly Expiry Predictions"),
-                gr.Plot(label="Monthly Expiry Predictions")
-            ],
-            title="Advanced BankNifty Option Chain Strategy Generator",
-            description="This model predicts close price, volume, and open interest for weekly and monthly expiries."
-        )
-        iface.launch()
-    except Exception as e:
-        logging.error(f"Error in main execution: {str(e)}")

 import torch.nn as nn
 import torch.optim as optim
 from torch.utils.data import Dataset, DataLoader
 from sklearn.preprocessing import StandardScaler
+from sklearn.model_selection import train_test_split
 import gradio as gr
+import os
+# Define the Dataset class
 class BankNiftyDataset(Dataset):
+    def __init__(self, data, seq_len, target_cols=['close']):
         self.data = data
         self.seq_len = seq_len
         self.target_cols = target_cols
     def __len__(self):
+        return max(0, len(self.data) - self.seq_len + 1)
     def __getitem__(self, idx):
+        seq_data = self.data.iloc[idx:idx+self.seq_len]
         features = torch.tensor(seq_data[['open', 'high', 'low', 'close', 'volume', 'oi']].values, dtype=torch.float32)
         label = torch.tensor(seq_data[self.target_cols].iloc[-1].values, dtype=torch.float32)
         return features, label
+# Define the LSTM model
+class LSTMModel(nn.Module):
+    def __init__(self, input_dim, hidden_dim, output_dim, num_layers=2, dropout=0.1):
+        super(LSTMModel, self).__init__()
         self.lstm = nn.LSTM(input_dim, hidden_dim, num_layers=num_layers, batch_first=True, dropout=dropout)
         self.fc = nn.Sequential(
+            nn.Linear(hidden_dim, hidden_dim // 2),
             nn.ReLU(),
             nn.Dropout(dropout),
+            nn.Linear(hidden_dim // 2, output_dim)
         )
     def forward(self, x):
         lstm_out, _ = self.lstm(x)
+        out = self.fc(lstm_out[:, -1, :])
         return out
+# Function to train the model
+def train_model(model, train_loader, val_loader, num_epochs=10):
+    criterion = nn.MSELoss()
+    optimizer = optim.Adam(model.parameters(), lr=0.001)
+    for epoch in range(num_epochs):
+        model.train()
+        for features, labels in train_loader:
+            optimizer.zero_grad()
+            outputs = model(features)
+            loss = criterion(outputs, labels)
+            loss.backward()
+            optimizer.step()
+        model.eval()
+        val_loss = 0
+        with torch.no_grad():
+            for features, labels in val_loader:
+                outputs = model(features)
+                val_loss += criterion(outputs, labels).item()
+        val_loss /= len(val_loader)
+        print(f"Epoch {epoch+1}/{num_epochs}, Validation Loss: {val_loss:.4f}")
+# Function to generate trading signals
+def generate_signals(predictions, actual_values, stop_loss_threshold=0.05):
+    signals = []
+    for pred, actual in zip(predictions, actual_values):
+        if pred > actual * (1 + stop_loss_threshold):
+            signals.append("Buy CE")
+        elif pred < actual * (1 - stop_loss_threshold):
+            signals.append("Buy PE")
+        else:
+            signals.append("Hold")
+    return signals
+# Function to generate a report
+def generate_report(predictions, actual_values, signals):
+    report = []
+    cumulative_profit = 0
+    for i in range(len(signals)):
+        signal = signals[i]
+        profit = actual_values[i] - predictions[i]
+        if signal == "Buy CE":
+            cumulative_profit += profit
+        elif signal == "Buy PE":
+            cumulative_profit -= profit
+        report.append(f"Signal: {signal}, Actual: {actual_values[i]:.2f}, Predicted: {predictions[i]:.2f}, Profit: {profit:.2f}")
+    total_profit = cumulative_profit
+    report.append(f"Total Profit: {total_profit:.2f}")
+    return "\n".join(report)
+# Function to process data and make predictions
+def predict():
+    # Load the pre-existing CSV file
+    csv_path = 'BANKNIFTY_OPTION_CHAIN_data.csv'
+    if not os.path.exists(csv_path):
+        return "Error: CSV file not found in the expected location."
+    # Load and preprocess data
+    data = pd.read_csv(csv_path)
+    scaler = StandardScaler()
+    scaled_data = scaler.fit_transform(data[['open', 'high', 'low', 'close', 'volume', 'oi']])
+    data[['open', 'high', 'low', 'close', 'volume', 'oi']] = scaled_data
+    # Split data
+    train_data, val_data = train_test_split(data, test_size=0.2, random_state=42)
+    # Create datasets and dataloaders
+    seq_len = 20
+    target_cols = ['close']
+    train_dataset = BankNiftyDataset(train_data, seq_len, target_cols)
+    val_dataset = BankNiftyDataset(val_data, seq_len, target_cols)
+    train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
+    val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)
+    # Initialize and train the model
+    input_dim = 6
+    hidden_dim = 64
+    output_dim = len(target_cols)
+    model = LSTMModel(input_dim, hidden_dim, output_dim)
+    train_model(model, train_loader, val_loader)
+    # Make predictions
     model.eval()
+    predictions = []
+    actual_values = val_data['close'].values[seq_len-1:]
     with torch.no_grad():
+        for i in range(len(val_dataset)):
+            features, _ = val_dataset[i]
+            pred = model(features.unsqueeze(0)).item()
+            predictions.append(pred)
+    # Generate signals and report
+    signals = generate_signals(predictions, actual_values)
+    report = generate_report(predictions, actual_values, signals)
+    return report
+# Set up the Gradio interface
+iface = gr.Interface(
+    fn=predict,
+    inputs=None,
+    outputs=gr.Textbox(label="Prediction Report"),
+    title="BankNifty Option Chain Predictor",
+    description="Click 'Submit' to generate predictions and trading signals based on the pre-loaded BankNifty option chain data."
+)
+# Launch the app
+iface.launch()