Spaces:

vanderbilt-dsi
/

cgd-ui-panel

Running

App Files Files Community

myshirk commited on 9 days ago

Commit

1e66d1d

verified ·

1 Parent(s): 630223b

update to tabulator

Browse files

Files changed (1) hide show

app.py +51 -48

app.py CHANGED Viewed

@@ -1,17 +1,17 @@
-# app_panel.py – Panel-based CGD Survey Explorer
-import os, io, json, gc
 import panel as pn
 import pandas as pd
 import boto3, torch
-from sentence_transformers import SentenceTransformer, util
 import psycopg2
 pn.extension()
-# ───────────────────────────────────────────────
-# 1) Data / Embeddings Loaders
-# ───────────────────────────────────────────────
 DB_HOST = os.getenv("DB_HOST")
 DB_PORT = os.getenv("DB_PORT", "5432")
 DB_NAME = os.getenv("DB_NAME")
@@ -35,7 +35,6 @@ def get_data():
     return df_
 df = get_data()
-row_lookup = {row.id: i for i, row in df.iterrows()}
 @pn.cache()
 def load_embeddings():
@@ -47,15 +46,19 @@ def load_embeddings():
     buf.close(); gc.collect()
     return ckpt["ids"], ckpt["embeddings"]
-ids_list, emb_tensor = load_embeddings()
 @pn.cache()
 def get_st_model():
     return SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2", device="cpu")
-# ───────────────────────────────────────────────
 # 2) Widgets
-# ───────────────────────────────────────────────
 country_opts = sorted(df["country"].dropna().unique())
 year_opts = sorted(df["year"].dropna().unique())
@@ -64,15 +67,22 @@ w_years = pn.widgets.MultiSelect(name="Years", options=year_opts)
 w_keyword = pn.widgets.TextInput(name="Keyword Search", placeholder="Search questions or answers")
 w_group = pn.widgets.Checkbox(name="Group by Question Text", value=False)
-# Semantic search
 w_semquery = pn.widgets.TextInput(name="Semantic Query")
-w_search_button = pn.widgets.Button(name="Search", button_type="primary", disabled=False)
-# ───────────────────────────────────────────────
-# 3) Filtering Logic
-# ───────────────────────────────────────────────
-@pn.depends(w_countries, w_years, w_keyword, w_group)
-def keyword_filter(countries, years, keyword, group):
     filt = df.copy()
     if countries:
         filt = filt[filt["country"].isin(countries)]
@@ -100,23 +110,18 @@ def keyword_filter(countries, years, keyword, group):
                 "answer_text": "Sample Answers"
             })
         )
-        return pn.pane.DataFrame(grouped, sizing_mode="stretch_width", height=400)
-    return pn.pane.DataFrame(
-        filt[["country", "year", "question_text", "answer_text"]],
-        sizing_mode="stretch_width", height=400
-    )
-# ────────────��──────────────────────────────────
-# 4) Semantic Search Callback
-# ───────────────────────────────────────────────
 def semantic_search(event=None):
     query = w_semquery.value.strip()
     if not query:
         return
-    model = get_st_model()
     q_vec = model.encode(query, convert_to_tensor=True, device="cpu").cpu()
     sims = util.cos_sim(q_vec, emb_tensor)[0]
     top_vals, top_idx = torch.topk(sims, k=50)
@@ -126,30 +131,31 @@ def semantic_search(event=None):
     sem_rows["Score"] = sem_rows["id"].map(score_map)
     sem_rows = sem_rows.sort_values("Score", ascending=False)
-    # Get keyword-filtered data
-    keyword_df = keyword_filter(
-        w_countries.value,
-        w_years.value,
-        w_keyword.value,
-        False
-    ).object
-    remainder = keyword_df.loc[~keyword_df["id"].isin(sem_ids)].copy()
     remainder["Score"] = ""
     combined = pd.concat([sem_rows, remainder], ignore_index=True)
-    result_pane.object = combined[["Score", "country", "year", "question_text", "answer_text"]]
 w_search_button.on_click(semantic_search)
-result_pane = pn.pane.DataFrame(height=500, sizing_mode="stretch_width")
-# ───────────────────────────────────────────────
-# 5) Layout
-# ───────────────────────────────────────────────
 sidebar = pn.Column(
-    "## 🔍 Filter Questions",
     w_countries, w_years, w_keyword, w_group,
     pn.Spacer(height=20),
     "## 🧠 Semantic Search",
@@ -159,10 +165,7 @@ sidebar = pn.Column(
 main = pn.Column(
     pn.pane.Markdown("## 🌍 CGD Survey Explorer"),
-    pn.Tabs(
-        ("Filtered Results", keyword_filter),
-        ("Semantic Search Results", result_pane),
-    )
 )
 pn.template.FastListTemplate(

+# app.py – Unified Panel App with Semantic Search + Filterable Tabulator
+import os, io, gc
 import panel as pn
 import pandas as pd
 import boto3, torch
 import psycopg2
+from sentence_transformers import SentenceTransformer, util
 pn.extension()
+# ──────────────────────────────────────────────────────────────────────
+# 1) Database and Resource Loading
+# ──────────────────────────────────────────────────────────────────────
 DB_HOST = os.getenv("DB_HOST")
 DB_PORT = os.getenv("DB_PORT", "5432")
 DB_NAME = os.getenv("DB_NAME")
     return df_
 df = get_data()
 @pn.cache()
 def load_embeddings():
     buf.close(); gc.collect()
     return ckpt["ids"], ckpt["embeddings"]
 @pn.cache()
 def get_st_model():
     return SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2", device="cpu")
+@pn.cache()
+def get_semantic_resources():
+    model = get_st_model()
+    ids_list, emb_tensor = load_embeddings()
+    return model, ids_list, emb_tensor
+# ──────────────────────────────────────────────────────────────────────
 # 2) Widgets
+# ──────────────────────────────────────────────────────────────────────
 country_opts = sorted(df["country"].dropna().unique())
 year_opts = sorted(df["year"].dropna().unique())
 w_keyword = pn.widgets.TextInput(name="Keyword Search", placeholder="Search questions or answers")
 w_group = pn.widgets.Checkbox(name="Group by Question Text", value=False)
 w_semquery = pn.widgets.TextInput(name="Semantic Query")
+w_search_button = pn.widgets.Button(name="Semantic Search", button_type="primary")
+# ──────────────────────────────────────────────────────────────────────
+# 3) Unified Results Table (Tabulator)
+# ──────────────────────────────────────────────────────────────────────
+result_table = pn.widgets.Tabulator(
+    pagination='remote',
+    page_size=15,
+    sizing_mode="stretch_width",
+    layout='fit_columns',
+    show_index=False,
+)
+@pn.depends(w_countries, w_years, w_keyword, w_group, watch=True)
+def update_table(countries, years, keyword, group):
     filt = df.copy()
     if countries:
         filt = filt[filt["country"].isin(countries)]
                 "answer_text": "Sample Answers"
             })
         )
+        result_table.value = grouped
+    else:
+        result_table.value = filt[["country", "year", "question_text", "answer_text"]]
 def semantic_search(event=None):
     query = w_semquery.value.strip()
     if not query:
         return
+    model, ids_list, emb_tensor = get_semantic_resources()
     q_vec = model.encode(query, convert_to_tensor=True, device="cpu").cpu()
     sims = util.cos_sim(q_vec, emb_tensor)[0]
     top_vals, top_idx = torch.topk(sims, k=50)
     sem_rows["Score"] = sem_rows["id"].map(score_map)
     sem_rows = sem_rows.sort_values("Score", ascending=False)
+    filt = df.copy()
+    if w_countries.value:
+        filt = filt[filt["country"].isin(w_countries.value)]
+    if w_years.value:
+        filt = filt[filt["year"].isin(w_years.value)]
+    if w_keyword.value:
+        filt = filt[
+            filt["question_text"].str.contains(w_keyword.value, case=False, na=False) |
+            filt["answer_text"].str.contains(w_keyword.value, case=False, na=False) |
+            filt["question_code"].astype(str).str.contains(w_keyword.value, case=False, na=False)
+        ]
+    remainder = filt.loc[~filt["id"].isin(sem_ids)].copy()
     remainder["Score"] = ""
     combined = pd.concat([sem_rows, remainder], ignore_index=True)
+    result_table.value = combined[["Score", "country", "year", "question_text", "answer_text"]]
 w_search_button.on_click(semantic_search)
+# ──────────────────────────────────────────────────────────────────────
+# 4) Layout
+# ──────────────────────────────────────────────────────────────────────
 sidebar = pn.Column(
+    "## 🔎 Filters",
     w_countries, w_years, w_keyword, w_group,
     pn.Spacer(height=20),
     "## 🧠 Semantic Search",
 main = pn.Column(
     pn.pane.Markdown("## 🌍 CGD Survey Explorer"),
+    result_table
 )
 pn.template.FastListTemplate(