Spaces:

lenawilli
/

SOE_Python_StreamlitApp

Sleeping

File size: 3,075 Bytes

1eb2368
 
 
 
 
078fee7
0be83b6
0eec7e8
078fee7
0eec7e8
078fee7
0be83b6
078fee7
 
1eb2368
 
 
078fee7
0eec7e8
 
 
 
0be83b6
0eec7e8
 
 
078fee7
 
 
1eb2368
 
 
078fee7
 
 
0eec7e8
078fee7
0eec7e8
078fee7
 
 
0eec7e8
078fee7
0eec7e8
1eb2368
 
0eec7e8
1eb2368
 
 
 
0eec7e8
078fee7
0eec7e8
1eb2368
 
 
0eec7e8
1eb2368
 
 
078fee7
 
 
1eb2368
0eec7e8
1eb2368
 
 
 
078fee7
0eec7e8
078fee7
 
1eb2368
 
 
 
 
 
 
 
078fee7
1eb2368
 
 
 
 
0eec7e8
1eb2368
0eec7e8

import streamlit as st
import pandas as pd
import numpy as np
import tensorflow as tf
import joblib
import os
import zipfile
import tempfile

# Paths
BASE_DIR = os.path.dirname(__file__)
ZIP_MODEL_PATH = os.path.join(BASE_DIR, "recommender_model.zip")
MOVIES_PATH = os.path.join(BASE_DIR, "movies.csv")
ENCODINGS_PATH = os.path.join(BASE_DIR, "encodings.pkl")

@st.cache_resource
def load_model():
    try:
        extract_dir = os.path.join(tempfile.gettempdir(), "recommender_model")

        # Extract only if not already extracted
        if not os.path.exists(extract_dir):
            with zipfile.ZipFile(ZIP_MODEL_PATH, "r") as zip_ref:
                zip_ref.extractall(extract_dir)

        return tf.keras.models.load_model(extract_dir)
    except Exception as e:
        st.error(f"Failed to load model: {e}")
        st.stop()

@st.cache_data
def load_assets():
    try:
        df_movies = pd.read_csv(MOVIES_PATH)
    except FileNotFoundError:
        st.error("❌ Error: movies.csv not found.")
        st.stop()

    try:
        user_map, movie_map = joblib.load(ENCODINGS_PATH)
    except FileNotFoundError:
        st.error("❌ Error: encodings.pkl not found.")
        st.stop()

    return df_movies, user_map, movie_map

# Load model and assets
model = load_model()
movies_df, user2idx, movie2idx = load_assets()
reverse_movie_map = {v: k for k, v in movie2idx.items()}

# UI
st.title("🎬 TensorFlow Movie Recommender")
st.write("Select some movies you've liked to get personalized recommendations:")

movie_titles = movies_df.set_index("movieId")["title"].to_dict()
movie_choices = [movie_titles[mid] for mid in movie2idx.keys() if mid in movie_titles]
selected_titles = st.multiselect("🎞️ Liked movies", sorted(movie_choices))

user_ratings = {}
for title in selected_titles:
    movie_id = next((k for k, v in movie_titles.items() if v == title), None)
    if movie_id:
        user_ratings[movie_id] = 5.0

if st.button("🎯 Get Recommendations"):
    if not user_ratings:
        st.warning("Please select at least one movie.")
    else:
        liked_indices = [movie2idx[m] for m in user_ratings if m in movie2idx]
        if not liked_indices:
            st.error("⚠️ No valid movie encodings found.")
            st.stop()

        avg_embedding = tf.reduce_mean(model.layers[2](tf.constant(liked_indices)), axis=0, keepdims=True)
        all_movie_indices = tf.range(len(movie2idx))
        movie_embeddings = model.layers[3](all_movie_indices)
        scores = tf.reduce_sum(avg_embedding * movie_embeddings, axis=1).numpy()
        top_indices = np.argsort(scores)[::-1]

        recommended = []
        for idx in top_indices:
            mid = reverse_movie_map.get(idx)
            if mid not in user_ratings and mid in movie_titles:
                recommended.append((movie_titles[mid], scores[idx]))
            if len(recommended) >= 10:
                break

        st.subheader("🍿 Top 10 Recommendations")
        for title, score in recommended:
            st.write(f"**{title}** — Score: `{score:.3f}`")