Spaces:

MicroHealth
/

maiko-transcription

Paused

App Files Files Community

bluenevus commited on May 3

Commit

86821c0

verified ·

1 Parent(s): cdffd44

Update app.py

Browse files

Files changed (1) hide show

app.py +123 -547

app.py CHANGED Viewed

@@ -54,17 +54,7 @@ if not grok_api_key:
 server = flask.Flask(__name__)
 app = dash.Dash(__name__, server=server, external_stylesheets=[dbc.themes.BOOTSTRAP], suppress_callback_exceptions=True)
-session_data = defaultdict(lambda: {
-    "audio_path": None,
-    "transcript": None,
-    "minutes": None,
-    "temp_dir": None,
-    "original_filename": None,
-    "diarized_transcript": None,
-    "diarization_done": False,
-    "advanced_diarized_transcript": None,
-    "preview_mode": "auto"
-})
 session_locks = defaultdict(threading.Lock)
 def get_session_dir(session_id):
@@ -163,186 +153,6 @@ def transcribe_audio(file_path):
         logging.error(f"An unexpected error occurred during transcription: {e}")
         return f"Error during transcription: An unexpected error occurred."
-def diarize_transcript_ai(transcript, model_name, session_id):
-    logging.info(f"Starting AI diarization using {model_name} for session {session_id}")
-    if not transcript or "Error:" in transcript:
-        return "Error: Cannot diarize invalid or missing transcript."
-    prompt = (
-        "You are given a transcript of a conversation or meeting. "
-        "Please analyze the text and assign speaker turns as Speaker 1, Speaker 2, etc. "
-        "If a person introduces themselves by name, try to use their name as the speaker label. "
-        "Otherwise, assign speakers based on changes in voice, speech patterns, or cues in the transcript. "
-        "Format the output as alternating lines, each starting with the speaker label, for example:\n"
-        "Speaker 1: Hello and welcome.\n"
-        "Speaker 2: Thank you. My name is Alex.\n"
-        "Alex: I have a question about...\n"
-        "Speaker 1: Please go ahead.\n"
-        "If unsure, use Speaker 1, Speaker 2, etc. Do not invent content.\n\n"
-        f"Transcript:\n{transcript}\n\n"
-        "Diarized Transcript:"
-    )
-    with session_locks[session_id]:
-        try:
-            if model_name == 'openai':
-                if not openai.api_key: return "Error: OpenAI API key not configured."
-                client = openai.OpenAI()
-                response = client.chat.completions.create(
-                    model="gpt-3.5-turbo",
-                    messages=[
-                        {"role": "system", "content": "You are a professional assistant for meeting AI diarization."},
-                        {"role": "user", "content": prompt}
-                    ],
-                    timeout=120
-                )
-                logging.info(f"OpenAI diarization successful for session {session_id}")
-                return response.choices[0].message.content
-            elif model_name == 'gemini':
-                if not genai: return "Error: Google Gemini API not configured or key missing."
-                model = genai.GenerativeModel('gemini-1.5-flash-latest')
-                response = model.generate_content(
-                    prompt,
-                    request_options={'timeout': 120}
-                )
-                logging.info(f"Gemini diarization successful for session {session_id}")
-                if response.parts:
-                     return response.text
-                else:
-                     logging.warning(f"Gemini response blocked or empty for diarization for session {session_id}. Reason: {response.prompt_feedback}")
-                     return f"Error: Gemini response blocked or empty. Reason: {response.prompt_feedback}"
-            elif model_name == 'anthropic':
-                 if not anthropic: return "Error: Anthropic API not configured or key missing."
-                 response = anthropic.messages.create(
-                     model="claude-3-5-haiku-20241022",
-                     max_tokens=2000,
-                     messages=[
-                         {
-                             "role": "user",
-                             "content": prompt
-                         }
-                     ],
-                     timeout=120
-                 )
-                 logging.info(f"Anthropic diarization successful for session {session_id}")
-                 if response.content and isinstance(response.content, list) and hasattr(response.content[0], 'text'):
-                     return response.content[0].text
-                 else:
-                     logging.error(f"Could not extract content from Anthropic response (diarization): {response}")
-                     return "Error: Could not extract content from Anthropic response."
-            elif model_name == 'grok':
-                if not grok_api_key: return "Error: Grok API key (via Groq) not configured."
-                groq_url = "https://api.groq.com/openai/v1/chat/completions"
-                headers = {
-                    "Authorization": f"Bearer {grok_api_key}",
-                    "Content-Type": "application/json"
-                }
-                data = {
-                     "model": "grok-3-mini-fast-beta",
-                     "messages": [
-                        {"role": "system", "content": "You are a professional assistant for meeting AI diarization."},
-                        {"role": "user", "content": prompt}
-                        ],
-                     "max_tokens": 2000,
-                     "temperature": 0.7
-                }
-                response = requests.post(groq_url, headers=headers, json=data, timeout=120)
-                response.raise_for_status()
-                logging.info(f"Groq ({data['model']}) diarization successful for session {session_id}")
-                return response.json()["choices"][0]["message"]["content"]
-            else:
-                logging.warning(f"Invalid model selection for diarization: {model_name}")
-                return "Error: Invalid model selection"
-        except Exception as e:
-            logging.error(f"Error diarizing transcript with {model_name} for session {session_id}: {e}", exc_info=True)
-            return f"Error diarizing transcript using {model_name}: An unexpected error occurred."
-def advanced_diarize_transcript_ai(transcript, model_name, session_id):
-    logging.info(f"Starting advanced AI diarization using {model_name} for session {session_id}")
-    if not transcript or "Error:" in transcript:
-        return "Error: Cannot diarize invalid or missing transcript."
-    prompt = (
-        "Analyze the given transcript to identify distinct speakers without labeled identifiers. "
-        "Create unique speaker embeddings based on individual speech patterns, vocabulary choices, and linguistic styles. "
-        "Examine the context and content of each utterance to detect likely speaker changes. "
-        "Recognize typical conversation structures and turn-taking behaviors to differentiate between speakers. "
-        "Finally, use topic modeling to identify shifts in subject matter and areas of expertise, associating certain topics with specific speakers. "
-        "Based on this analysis, assign speaker labels (e.g., Speaker 1, Speaker 2, name if given) to each utterance in the transcript.\n\n"
-        f"Transcript:\n{transcript}\n\n"
-        "Diarized Transcript:"
-    )
-    with session_locks[session_id]:
-        try:
-            if model_name == 'openai':
-                if not openai.api_key: return "Error: OpenAI API key not configured."
-                client = openai.OpenAI()
-                response = client.chat.completions.create(
-                    model="gpt-3.5-turbo",
-                    messages=[
-                        {"role": "system", "content": "You are a professional assistant for meeting AI diarization."},
-                        {"role": "user", "content": prompt}
-                    ],
-                    timeout=120
-                )
-                logging.info(f"OpenAI advanced diarization successful for session {session_id}")
-                return response.choices[0].message.content
-            elif model_name == 'gemini':
-                if not genai: return "Error: Google Gemini API not configured or key missing."
-                model = genai.GenerativeModel('gemini-1.5-flash-latest')
-                response = model.generate_content(
-                    prompt,
-                    request_options={'timeout': 120}
-                )
-                logging.info(f"Gemini advanced diarization successful for session {session_id}")
-                if response.parts:
-                     return response.text
-                else:
-                     logging.warning(f"Gemini response blocked or empty for advanced diarization for session {session_id}. Reason: {response.prompt_feedback}")
-                     return f"Error: Gemini response blocked or empty. Reason: {response.prompt_feedback}"
-            elif model_name == 'anthropic':
-                 if not anthropic: return "Error: Anthropic API not configured or key missing."
-                 response = anthropic.messages.create(
-                     model="claude-3-5-haiku-20241022",
-                     max_tokens=2000,
-                     messages=[
-                         {
-                             "role": "user",
-                             "content": prompt
-                         }
-                     ],
-                     timeout=120
-                 )
-                 logging.info(f"Anthropic advanced diarization successful for session {session_id}")
-                 if response.content and isinstance(response.content, list) and hasattr(response.content[0], 'text'):
-                     return response.content[0].text
-                 else:
-                     logging.error(f"Could not extract content from Anthropic response (advanced diarization): {response}")
-                     return "Error: Could not extract content from Anthropic response."
-            elif model_name == 'grok':
-                if not grok_api_key: return "Error: Grok API key (via Groq) not configured."
-                groq_url = "https://api.groq.com/openai/v1/chat/completions"
-                headers = {
-                    "Authorization": f"Bearer {grok_api_key}",
-                    "Content-Type": "application/json"
-                }
-                data = {
-                     "model": "grok-3-mini-fast-beta",
-                     "messages": [
-                        {"role": "system", "content": "You are a professional assistant for meeting AI diarization."},
-                        {"role": "user", "content": prompt}
-                        ],
-                     "max_tokens": 2000,
-                     "temperature": 0.7
-                }
-                response = requests.post(groq_url, headers=headers, json=data, timeout=120)
-                response.raise_for_status()
-                logging.info(f"Groq ({data['model']}) advanced diarization successful for session {session_id}")
-                return response.json()["choices"][0]["message"]["content"]
-            else:
-                logging.warning(f"Invalid model selection for advanced diarization: {model_name}")
-                return "Error: Invalid model selection"
-        except Exception as e:
-            logging.error(f"Error in advanced diarization with {model_name} for session {session_id}: {e}", exc_info=True)
-            return f"Error advanced diarizing transcript using {model_name}: An unexpected error occurred."
 def generate_minutes_ai(transcript, model_name, session_id):
     logging.info(f"Generating minutes using {model_name} for session {session_id}")
     if not transcript or "Error:" in transcript:
@@ -465,112 +275,87 @@ app.layout = dbc.Container([
     dcc.Download(id="download-transcript"),
     dcc.Download(id="download-audio"),
     dcc.Download(id="download-minutes"),
-    dcc.Download(id="download-diarized"),
     dbc.Row([
-        dbc.Col(
-            dbc.Card(
-                dbc.CardBody([
-                    html.H4("Controls", className="card-title"),
-                    html.Div("Upload meeting audio or video file:"),
-                    dcc.Upload(
-                        id='audio-uploader',
-                        children=html.Div([
-                            'Drag and Drop or ',
-                            html.A('Select Audio/Video File')
-                        ]),
-                        style={
-                            'width': '100%',
-                            'height': '60px',
-                            'lineHeight': '60px',
-                            'borderWidth': '1px',
-                            'borderStyle': 'dashed',
-                            'borderRadius': '5px',
-                            'textAlign': 'center',
-                            'margin': '10px 0'
-                        },
-                        multiple=False,
-                        accept='audio/*,video/*'
-                    ),
-                    html.Div(id='upload-status', children='Status: Ready to Upload', className="mt-2"),
-                    html.Div(id='uploaded-filename', style={'fontWeight': 'bold', 'marginBottom': '8px'}),
-                    html.Hr(),
-                    html.H5("View Output", className="mt-2"),
-                    dbc.Button("View Original Transcript", id="nav-original-btn", color="tertiary", className="mb-2 w-100"),
-                    dbc.Button("View Diarized Transcript", id="nav-diarized-btn", color="tertiary", className="mb-2 w-100"),
-                    dbc.Button("View Minutes", id="nav-minutes-btn", color="tertiary", className="mb-2 w-100"),
-                    html.Hr(),
-                    html.H5("Select AI Model", className="mt-2"),
-                    dcc.Dropdown(
-                        id='model-selection',
-                        options=[
-                            {'label': 'OpenAI GPT-3.5 Turbo', 'value': 'openai', 'disabled': not openai.api_key},
-                            {'label': 'Google Gemini 1.5 Flash', 'value': 'gemini', 'disabled': not genai},
-                            {'label': 'Anthropic Claude 3.5 Haiku', 'value': 'anthropic', 'disabled': not anthropic},
-                            {'label': 'Grok 3 Mini', 'value': 'grok', 'disabled': not grok_api_key}
-                        ],
-                        value='openai' if openai.api_key else (
-                            'gemini' if genai else (
-                                'anthropic' if anthropic else (
-                                    'grok' if grok_api_key else None
-                                )
-                            )
-                        ),
-                        clearable=False,
-                        className="mt-2",
-                        disabled=not (openai.api_key or genai or anthropic or grok_api_key)
-                    ),
-                    dbc.Checkbox(
-                        id="diarize-checkbox",
-                        className="mt-3",
-                        value=False,
-                        label="Diarize Speakers (AI)",
-                        style={"fontWeight": "bold"}
-                    ),
-                    dbc.Button("Diarize Transcript (Simple)", id="diarize-btn", color="primary", className="mt-2 w-100", disabled=True),
-                    dbc.Button("Diarize Transcript (Advanced)", id="advanced-diarize-btn", color="secondary", className="mt-2 w-100", disabled=True),
-                    dbc.Button("Download Diarized Transcript (.docx)", id="download-diarized-btn", color="info", className="mt-2 w-100", disabled=True),
-                    dbc.Button("Generate Minutes", id="minutes-btn", color="secondary", className="mt-4 w-100", disabled=True),
-                    dbc.Button("Delete Session Data", id="delete-btn", color="warning", className="mt-4 w-100", disabled=True),
-                ]),
-                style={'height': '80vh', 'overflow-y': 'auto'}
-            ), width=12, lg=4
-        ),
-        dbc.Col(
-            dbc.Card(
-                dbc.CardBody([
-                    dcc.Loading(
-                        id="loading",
-                        type="default",
-                        parent_style={'position': 'relative', 'height': '100%'},
-                        style={'position': 'absolute', 'top': '50%', 'left': '50%', 'transform': 'translate(-50%, -50%)', 'zIndex':'1000'},
-                        children=[
-                            html.Div([
-                                html.H4("Output", className="card-title"),
-                                html.Div(id="status", children="Status: Idle", className="mb-2"),
-                                html.H5("Transcript / Minutes"),
-                                html.Div(id="transcript-preview", style={
-                                    "height": "400px",
-                                    "overflow-y": "scroll",
-                                    "border": "1px solid #ccc",
-                                    "padding": "10px",
-                                    "white-space": "pre-wrap",
-                                    "word-wrap": "break-word",
-                                    "background-color": "#f9f9f9"
-                                }),
-                                html.H5("Downloads", className="mt-3"),
-                                dbc.Row([
-                                    dbc.Col(dbc.Button("Download Transcript (.docx)", id="download-transcript-btn", color="info", className="w-100 mb-2", disabled=True), width=12, md=4),
-                                    dbc.Col(dbc.Button("Download Minutes (.docx)", id="download-minutes-btn", color="info", className="w-100 mb-2", disabled=True), width=12, md=4),
-                                    dbc.Col(dbc.Button("Download Processed Audio", id="download-audio-btn", color="info", className="w-100 mb-2", disabled=True), width=12, md=4),
-                                ]),
-                            ])
-                        ]
-                    ),
-                    html.Div(id="loading-output", style={"height": "0px", "visibility": "hidden"}),
-                ]),
-                style={'height': '80vh', 'overflow-y': 'auto', 'position': 'relative'}
-            ), width=12, lg=8
-        ),
     ])
 ], fluid=True)
@@ -607,81 +392,38 @@ def manage_session_id(existing_session_id):
     return final_session_id
 @app.callback(
-    [
-        Output("status", "children"),
-        Output("transcript-preview", "children"),
-        Output("minutes-btn", "disabled"),
-        Output("download-transcript-btn", "disabled"),
-        Output("download-minutes-btn", "disabled"),
-        Output("download-audio-btn", "disabled"),
-        Output("delete-btn", "disabled"),
-        Output("loading-output", "children"),
-        Output("upload-status", "children"),
-        Output("diarize-btn", "disabled"),
-        Output("download-diarized-btn", "disabled"),
-        Output("uploaded-filename", "children"),
-        Output("advanced-diarize-btn", "disabled"),
-    ],
-    [
-        Input('audio-uploader', 'contents'),
-        Input("minutes-btn", "n_clicks"),
-        Input("delete-btn", "n_clicks"),
-        Input("diarize-btn", "n_clicks"),
-        Input("diarize-checkbox", "value"),
-        Input("nav-original-btn", "n_clicks"),
-        Input("nav-diarized-btn", "n_clicks"),
-        Input("nav-minutes-btn", "n_clicks"),
-        Input("advanced-diarize-btn", "n_clicks"),
-    ],
-    [
-        State("session-id", "data"),
-        State("model-selection", "value"),
-        State("transcript-preview", "children"),
-        State('audio-uploader', 'filename'),
-        State("diarize-checkbox", "value")
-    ],
     prevent_initial_call=True
 )
-def handle_actions(
-    upload_contents, minutes_clicks, delete_clicks, diarize_clicks, diarize_checkbox_val,
-    nav_original_clicks, nav_diarized_clicks, nav_minutes_clicks, advanced_diarize_clicks,
-    session_id, selected_model, existing_preview, filename, diarize_checkbox_val2
-):
-    diarize_checkbox = diarize_checkbox_val if diarize_checkbox_val is not None else diarize_checkbox_val2
     if not session_id:
         logging.warning("Session ID missing in handle_actions.")
-        return "Status: Error - Session ID missing", "", True, True, True, True, True, None, "Status: Error", True, True, "", True
     ctx = dash.callback_context
     triggered_id = ctx.triggered_id if hasattr(ctx, 'triggered_id') else (ctx.triggered[0]['prop_id'].split('.')[0] if ctx.triggered else None)
     current_transcript = session_data[session_id].get("transcript", "")
     current_minutes = session_data[session_id].get("minutes", "")
     current_audio_path = session_data[session_id].get("audio_path", None)
     original_filename = session_data[session_id].get("original_filename", None)
-    diarized_transcript = session_data[session_id].get("diarized_transcript", None)
-    diarization_done = session_data[session_id].get("diarization_done", False)
-    advanced_diarized_transcript = session_data[session_id].get("advanced_diarized_transcript", None)
-    preview_mode = session_data[session_id].get("preview_mode", "auto")
-    output_text = ""
-    # Preview mode logic
-    if preview_mode == "original":
-        output_text = current_transcript if current_transcript else "No transcript available."
-    elif preview_mode == "diarized":
-        output_text = advanced_diarized_transcript if advanced_diarized_transcript else (diarized_transcript if diarized_transcript else "No diarized transcript available.")
-    elif preview_mode == "minutes":
-        output_text = current_minutes if current_minutes else "No minutes available."
-    else:
-        output_text = current_minutes if current_minutes else (
-            advanced_diarized_transcript if advanced_diarized_transcript else (
-                diarized_transcript if diarize_checkbox and diarized_transcript else (
-                    current_transcript if current_transcript else "Upload an audio or video file to begin."
-                )
-            )
-        )
     status_msg = "Status: Idle"
     if current_minutes and "Error:" not in current_minutes:
         status_msg = "Status: Session restored. Minutes loaded."
-    elif (diarize_checkbox or advanced_diarized_transcript) and (advanced_diarized_transcript or diarized_transcript) and "Error:" not in (advanced_diarized_transcript or diarized_transcript or ""):
-        status_msg = "Status: Session restored. Diarized transcript loaded."
     elif current_transcript and "Error:" not in current_transcript:
         status_msg = "Status: Session restored. Transcript loaded. Ready for Minutes Generation."
     elif current_audio_path and os.path.exists(current_audio_path):
@@ -693,18 +435,12 @@ def handle_actions(
     dl_minutes_disabled = not bool(current_minutes and "Error:" not in current_minutes)
     dl_audio_disabled = not bool(current_audio_path and os.path.exists(current_audio_path))
     delete_disabled = not bool(session_data.get(session_id, {}).get("temp_dir"))
-    diarize_disabled = not bool(current_transcript and "Error:" not in current_transcript)
-    dl_diarized_disabled = not bool((advanced_diarized_transcript or diarized_transcript) and "Error:" not in (advanced_diarized_transcript or diarized_transcript or ""))
-    uploaded_filename_text = original_filename if original_filename else ""
-    advanced_diarize_disabled = diarize_disabled
     loading_output = None
     upload_status_msg = f"Status: {'Loaded: ' + original_filename if original_filename else 'Ready to Upload'}"
     start_time = time.time()
-    # File upload logic
     if triggered_id == 'audio-uploader' and upload_contents is not None and filename is not None:
         logging.info(f"File uploaded for session {session_id}, filename: {filename}")
         session_data[session_id]["original_filename"] = filename
-        uploaded_filename_text = filename
         upload_status_msg = f"Status: Processing Uploaded File ({filename})..."
         status_msg = "Status: Processing Upload..."
         loading_output = "Processing Upload..."
@@ -719,18 +455,12 @@ def handle_actions(
              session_data[session_id]["transcript"] = None
              session_data[session_id]["minutes"] = None
              session_data[session_id]["original_filename"] = None
-             session_data[session_id]["diarized_transcript"] = None
-             session_data[session_id]["diarization_done"] = False
-             session_data[session_id]["advanced_diarized_transcript"] = None
              minutes_disabled = True
              dl_transcript_disabled = True
              dl_minutes_disabled = True
              dl_audio_disabled = True
              delete_disabled = False
-             diarize_disabled = True
-             dl_diarized_disabled = True
-             advanced_diarize_disabled = True
-             return status_msg, output_text, minutes_disabled, dl_transcript_disabled, dl_minutes_disabled, dl_audio_disabled, delete_disabled, None, upload_status_msg, diarize_disabled, dl_diarized_disabled, uploaded_filename_text, advanced_diarize_disabled
         safe_upload_filename = f"uploaded_file{f_ext}"
         upload_file_path = os.path.join(session_dir, safe_upload_filename)
         saved_upload_path = save_base64_data(upload_contents, upload_file_path)
@@ -762,13 +492,7 @@ def handle_actions(
                     dl_minutes_disabled = True
                     dl_audio_disabled = True
                     delete_disabled = False
-                    diarize_disabled = True
-                    dl_diarized_disabled = True
-                    session_data[session_id]["diarized_transcript"] = None
-                    session_data[session_id]["diarization_done"] = False
-                    session_data[session_id]["advanced_diarized_transcript"] = None
-                    advanced_diarize_disabled = True
-                    return status_msg, output_text, minutes_disabled, dl_transcript_disabled, dl_minutes_disabled, dl_audio_disabled, delete_disabled, None, upload_status_msg, diarize_disabled, dl_diarized_disabled, uploaded_filename_text, advanced_diarize_disabled
             else:
                 audio_path_for_transcription = saved_upload_path
                 session_data[session_id]["audio_path"] = saved_upload_path
@@ -781,9 +505,6 @@ def handle_actions(
                 transcript_text = transcribe_audio(audio_path_for_transcription)
                 session_data[session_id]["transcript"] = transcript_text
                 session_data[session_id]["minutes"] = None
-                session_data[session_id]["diarized_transcript"] = None
-                session_data[session_id]["diarization_done"] = False
-                session_data[session_id]["advanced_diarized_transcript"] = None
                 if "Error:" in transcript_text:
                      status_msg = f"Status: Transcription Failed - {transcript_text}"
                      output_text = transcript_text
@@ -792,9 +513,6 @@ def handle_actions(
                      dl_minutes_disabled = True
                      delete_disabled = False
                      upload_status_msg = f"Status: Transcription Failed. ({filename})"
-                     diarize_disabled = True
-                     dl_diarized_disabled = True
-                     advanced_diarize_disabled = True
                 else:
                      status_msg = "Status: Transcription Complete. Ready for Minutes Generation."
                      output_text = transcript_text
@@ -803,9 +521,6 @@ def handle_actions(
                      dl_minutes_disabled = True
                      delete_disabled = False
                      upload_status_msg = f"Status: Processed & Transcribed: {filename}"
-                     diarize_disabled = False
-                     dl_diarized_disabled = True
-                     advanced_diarize_disabled = False
                 processing_time = time.time() - start_time
                 logging.info(f"File processing and transcription took {processing_time:.2f} seconds for session {session_id}")
         else:
@@ -819,28 +534,15 @@ def handle_actions(
             dl_minutes_disabled = True
             dl_audio_disabled = True
             delete_disabled = False
-            diarize_disabled = True
-            dl_diarized_disabled = True
-            session_data[session_id]["diarized_transcript"] = None
-            session_data[session_id]["diarization_done"] = False
-            session_data[session_id]["advanced_diarized_transcript"] = None
-            advanced_diarize_disabled = True
     elif triggered_id == "minutes-btn" and minutes_clicks:
         logging.info(f"Generate Minutes button clicked for session {session_id}")
-        transcript_to_use = None
-        if preview_mode == "diarized":
-            transcript_to_use = advanced_diarized_transcript if advanced_diarized_transcript else diarized_transcript
-        elif diarize_checkbox and (advanced_diarized_transcript or diarized_transcript):
-            transcript_to_use = advanced_diarized_transcript if advanced_diarized_transcript else diarized_transcript
-        else:
-            transcript_to_use = current_transcript
-        if transcript_to_use and "Error:" not in transcript_to_use:
             status_msg = f"Status: Generating Minutes ({selected_model})..."
             loading_output = "Generating Minutes..."
-            minutes_text = generate_minutes_ai(transcript_to_use, selected_model, session_id)
             session_data[session_id]["minutes"] = minutes_text
             output_text = minutes_text
-            session_data[session_id]["preview_mode"] = "minutes"
             if "Error:" in minutes_text:
                 status_msg = f"Status: Minutes Generation Failed - {minutes_text}"
                 dl_minutes_disabled = True
@@ -854,77 +556,10 @@ def handle_actions(
             dl_audio_disabled = not bool(session_data.get(session_id, {}).get("audio_path") and os.path.exists(session_data.get(session_id, {}).get("audio_path", "")))
             delete_disabled = False
             upload_status_msg = f"Status: Processed & Transcribed: {session_data[session_id].get('original_filename', 'File')}"
-            diarize_disabled = not bool(session_data[session_id].get("transcript") and "Error:" not in session_data[session_id].get("transcript"))
-            dl_diarized_disabled = not bool((session_data[session_id].get("advanced_diarized_transcript") or session_data[session_id].get("diarized_transcript")) and "Error:" not in (session_data[session_id].get("advanced_diarized_transcript") or session_data[session_id].get("diarized_transcript") or ""))
-            advanced_diarize_disabled = diarize_disabled
         else:
             status_msg = "Status: Cannot generate minutes - No valid transcript available."
             output_text = existing_preview
             minutes_disabled = True
-    elif triggered_id == "diarize-btn" and diarize_clicks:
-        logging.info(f"Diarize button clicked for session {session_id}")
-        current_transcript = session_data[session_id].get("transcript", "")
-        if current_transcript and "Error:" not in current_transcript:
-            status_msg = f"Status: Diarizing Transcript ({selected_model})..."
-            loading_output = "Diarizing..."
-            diarized_text = diarize_transcript_ai(current_transcript, selected_model, session_id)
-            session_data[session_id]["diarized_transcript"] = diarized_text
-            session_data[session_id]["diarization_done"] = "Error:" not in diarized_text
-            output_text = diarized_text
-            session_data[session_id]["preview_mode"] = "diarized"
-            if "Error:" in diarized_text:
-                status_msg = f"Status: Diarization Failed - {diarized_text}"
-                dl_diarized_disabled = True
-            else:
-                status_msg = "Status: Diarization Complete."
-                dl_diarized_disabled = False
-            diarize_disabled = False
-            advanced_diarize_disabled = False
-        else:
-            status_msg = "Status: Cannot diarize - No valid transcript available."
-            output_text = existing_preview
-            diarize_disabled = True
-            dl_diarized_disabled = True
-            advanced_diarize_disabled = True
-    elif triggered_id == "advanced-diarize-btn" and advanced_diarize_clicks:
-        logging.info(f"Advanced Diarize button clicked for session {session_id}")
-        current_transcript = session_data[session_id].get("transcript", "")
-        if current_transcript and "Error:" not in current_transcript:
-            status_msg = f"Status: Advanced Diarizing Transcript ({selected_model})..."
-            loading_output = "Advanced Diarizing..."
-            adv_diarized_text = advanced_diarize_transcript_ai(current_transcript, selected_model, session_id)
-            session_data[session_id]["advanced_diarized_transcript"] = adv_diarized_text
-            output_text = adv_diarized_text
-            session_data[session_id]["preview_mode"] = "diarized"
-            if "Error:" in adv_diarized_text:
-                status_msg = f"Status: Advanced Diarization Failed - {adv_diarized_text}"
-                dl_diarized_disabled = True
-            else:
-                status_msg = "Status: Advanced Diarization Complete."
-                dl_diarized_disabled = False
-            diarize_disabled = False
-            advanced_diarize_disabled = False
-        else:
-            status_msg = "Status: Cannot advanced diarize - No valid transcript available."
-            output_text = existing_preview
-            diarize_disabled = True
-            dl_diarized_disabled = True
-            advanced_diarize_disabled = True
-    elif triggered_id == "nav-original-btn" and nav_original_clicks:
-        logging.info(f"Nav: View Original Transcript for session {session_id}")
-        output_text = current_transcript if current_transcript else "No transcript available."
-        session_data[session_id]["preview_mode"] = "original"
-        status_msg = "Status: Viewing Original Transcript."
-    elif triggered_id == "nav-diarized-btn" and nav_diarized_clicks:
-        logging.info(f"Nav: View Diarized Transcript for session {session_id}")
-        output_text = advanced_diarized_transcript if advanced_diarized_transcript else (diarized_transcript if diarized_transcript else "No diarized transcript available.")
-        session_data[session_id]["preview_mode"] = "diarized"
-        status_msg = "Status: Viewing Diarized Transcript."
-    elif triggered_id == "nav-minutes-btn" and nav_minutes_clicks:
-        logging.info(f"Nav: View Minutes for session {session_id}")
-        output_text = current_minutes if current_minutes else "No minutes available."
-        session_data[session_id]["preview_mode"] = "minutes"
-        status_msg = "Status: Viewing Minutes."
     elif triggered_id == "delete-btn" and delete_clicks:
         logging.info(f"Delete button clicked for session {session_id}")
         cleanup_session(session_id)
@@ -935,49 +570,24 @@ def handle_actions(
         dl_minutes_disabled = True
         dl_audio_disabled = True
         delete_disabled = True
-        diarize_disabled = True
-        dl_diarized_disabled = True
-        advanced_diarize_disabled = True
         upload_status_msg = "Status: Ready to Upload"
-        uploaded_filename_text = ""
     else:
-        loaded_audio_path = session_data.get(session_id, {}).get("audio_path")
-        loaded_transcript = session_data.get(session_id, {}).get("transcript")
-        loaded_minutes = session_data.get(session_id, {}).get("minutes")
-        loaded_diarized = session_data.get(session_id, {}).get("diarized_transcript")
-        loaded_adv_diarized = session_data.get(session_id, {}).get("advanced_diarized_transcript")
-        temp_dir_exists = bool(session_data.get(session_id, {}).get("temp_dir"))
-        loaded_original_filename = session_data.get(session_id, {}).get("original_filename")
-        dl_audio_disabled = not (loaded_audio_path and os.path.exists(loaded_audio_path))
-        minutes_disabled = not (loaded_transcript and "Error:" not in loaded_transcript)
-        dl_transcript_disabled = not (loaded_transcript and "Error:" not in loaded_transcript)
-        dl_minutes_disabled = not (loaded_minutes and "Error:" not in loaded_minutes)
-        diarize_disabled = not (loaded_transcript and "Error:" not in loaded_transcript)
-        advanced_diarize_disabled = diarize_disabled
-        dl_diarized_disabled = not ((loaded_adv_diarized or loaded_diarized) and "Error:" not in (loaded_adv_diarized or loaded_diarized or ""))
-        delete_disabled = not (loaded_audio_path or loaded_transcript or loaded_minutes or loaded_diarized or temp_dir_exists or loaded_original_filename or loaded_adv_diarized)
-        if loaded_original_filename and dl_audio_disabled and not loaded_transcript:
-            upload_status_msg = f"Status: Error processing {loaded_original_filename}?"
-        elif loaded_audio_path and os.path.exists(loaded_audio_path):
-            upload_status_msg = f"Status: Processed audio loaded ({loaded_original_filename or 'previous file'})."
-        else:
-            upload_status_msg = "Status: Ready to Upload"
-        uploaded_filename_text = loaded_original_filename if loaded_original_filename else ""
-        pmode = session_data[session_id].get("preview_mode", "auto")
-        if pmode == "original":
-            output_text = loaded_transcript if loaded_transcript else "No transcript available."
-        elif pmode == "diarized":
-            output_text = loaded_adv_diarized if loaded_adv_diarized else (loaded_diarized if loaded_diarized else "No diarized transcript available.")
-        elif pmode == "minutes":
-            output_text = loaded_minutes if loaded_minutes else "No minutes available."
-        else:
-            output_text = loaded_minutes if loaded_minutes else (
-                loaded_adv_diarized if loaded_adv_diarized else (
-                    loaded_diarized if diarize_checkbox and loaded_diarized else (
-                        loaded_transcript if loaded_transcript else "Upload an audio or video file to begin."
-                    )
-                )
-            )
     return (
         status_msg,
         output_text,
@@ -987,11 +597,7 @@ def handle_actions(
         dl_audio_disabled,
         delete_disabled,
         loading_output,
-        upload_status_msg,
-        diarize_disabled,
-        dl_diarized_disabled,
-        uploaded_filename_text,
-        advanced_diarize_disabled
     )
 @app.callback(
@@ -1068,37 +674,7 @@ def download_audio_file(n_clicks, session_id):
         logging.error(f"Processed audio file not found at path {audio_path} for session {session_id}")
         return None
-@app.callback(
-    Output("download-diarized", "data"),
-    Input("download-diarized-btn", "n_clicks"),
-    State("session-id", "data"),
-    prevent_initial_call=True,
-)
-def download_diarized_file(n_clicks, session_id):
-    diarized = None
-    if session_id and session_data.get(session_id, {}).get("advanced_diarized_transcript"):
-        diarized = session_data[session_id]["advanced_diarized_transcript"]
-    elif session_id and session_data.get(session_id, {}).get("diarized_transcript"):
-        diarized = session_data[session_id]["diarized_transcript"]
-    else:
-        logging.warning(f"Download diarized transcript requested but no data found for session {session_id}.")
-        return None
-    if "Error:" in diarized:
-        logging.warning(f"Attempted to download diarized transcript containing an error for session {session_id}.")
-        return None
-    session_dir = get_session_dir(session_id)
-    diarized_filename = os.path.join(session_dir, f"diarized_{uuid.uuid4()}.docx")
-    saved_doc_path = save_to_word(diarized, diarized_filename)
-    if saved_doc_path:
-         logging.info(f"Sending diarized transcript file: {saved_doc_path}")
-         original_filename_base = os.path.splitext(session_data[session_id].get("original_filename", "meeting"))[0]
-         download_filename = f"{original_filename_base}_diarized.docx"
-         return dcc.send_file(saved_doc_path, filename=download_filename)
-    else:
-         logging.error(f"Failed to create Word document for diarized transcript download for session {session_id}")
-         return dcc.send_data_frame(lambda: diarized, "meeting_diarized.txt")
 if __name__ == '__main__':
     print("Starting the Dash application...")
-    app.run(debug=True, host='0.0.0.0', port=7860)
     print("Dash application has finished running.")

 server = flask.Flask(__name__)
 app = dash.Dash(__name__, server=server, external_stylesheets=[dbc.themes.BOOTSTRAP], suppress_callback_exceptions=True)
+session_data = defaultdict(lambda: {"audio_path": None, "transcript": None, "minutes": None, "temp_dir": None, "original_filename": None})
 session_locks = defaultdict(threading.Lock)
 def get_session_dir(session_id):
         logging.error(f"An unexpected error occurred during transcription: {e}")
         return f"Error during transcription: An unexpected error occurred."
 def generate_minutes_ai(transcript, model_name, session_id):
     logging.info(f"Generating minutes using {model_name} for session {session_id}")
     if not transcript or "Error:" in transcript:
     dcc.Download(id="download-transcript"),
     dcc.Download(id="download-audio"),
     dcc.Download(id="download-minutes"),
     dbc.Row([
+        dbc.Col(html.H1("AI Meeting Assistant", className="text-center my-4"), width=12)
+    ]),
+    dbc.Row([
+        dbc.Col(dbc.Card(
+            dbc.CardBody([
+                html.H4("Controls", className="card-title"),
+                html.Div("Upload meeting audio or video file:"),
+                dcc.Upload(
+                    id='audio-uploader',
+                    children=html.Div([
+                        'Drag and Drop or ',
+                        html.A('Select Audio/Video File')
+                    ]),
+                    style={
+                        'width': '100%',
+                        'height': '60px',
+                        'lineHeight': '60px',
+                        'borderWidth': '1px',
+                        'borderStyle': 'dashed',
+                        'borderRadius': '5px',
+                        'textAlign': 'center',
+                        'margin': '10px 0'
+                    },
+                    multiple=False,
+                    accept='audio/*,video/*'
+                ),
+                html.Div(id='upload-status', children='Status: Ready to Upload', className="mt-2"),
+                dbc.Button("Generate Minutes", id="minutes-btn", color="secondary", className="mt-3 w-100", disabled=True),
+                html.H5("Select AI Model", className="mt-4"),
+                dcc.Dropdown(
+                    id='model-selection',
+                    options=[
+                        {'label': 'OpenAI GPT-3.5 Turbo', 'value': 'openai', 'disabled': not openai.api_key},
+                        {'label': 'Google Gemini 1.5 Flash', 'value': 'gemini', 'disabled': not genai},
+                        {'label': 'Anthropic Claude 3.5 Haiku', 'value': 'anthropic', 'disabled': not anthropic},
+                        {'label': 'Grok 3 Mini', 'value': 'grok', 'disabled': not grok_api_key}
+                    ],
+                    value='openai' if openai.api_key else ('gemini' if genai else ('anthropic' if anthropic else ('grok' if grok_api_key else None))),
+                    clearable=False,
+                    className="mt-2",
+                    disabled=not (openai.api_key or genai or anthropic or grok_api_key)
+                ),
+                 dbc.Button("Delete Session Data", id="delete-btn", color="warning", className="mt-4 w-100", disabled=True),
+            ]),
+             style={'height': '80vh', 'overflow-y': 'auto'}
+        ), width=12, lg=4),
+        dbc.Col(dbc.Card(
+             dbc.CardBody([
+                dcc.Loading(
+                    id="loading",
+                    type="default",
+                    parent_style={'position': 'relative', 'height': '100%'},
+                    style={'position': 'absolute', 'top': '50%', 'left': '50%', 'transform': 'translate(-50%, -50%)', 'zIndex':'1000'},
+                    children=[
+                         html.Div([
+                            html.H4("Output", className="card-title"),
+                            html.Div(id="status", children="Status: Idle", className="mb-2"),
+                            html.H5("Transcript / Minutes"),
+                            html.Div(id="transcript-preview", style={
+                                "height": "400px",
+                                "overflow-y": "scroll",
+                                "border": "1px solid #ccc",
+                                "padding": "10px",
+                                "white-space": "pre-wrap",
+                                "word-wrap": "break-word",
+                                "background-color": "#f9f9f9"
+                            }),
+                            html.H5("Downloads", className="mt-3"),
+                             dbc.Row([
+                                dbc.Col(dbc.Button("Download Transcript (.docx)", id="download-transcript-btn", color="info", className="w-100 mb-2", disabled=True), width=12, md=4),
+                                dbc.Col(dbc.Button("Download Minutes (.docx)", id="download-minutes-btn", color="info", className="w-100 mb-2", disabled=True), width=12, md=4),
+                                dbc.Col(dbc.Button("Download Processed Audio", id="download-audio-btn", color="info", className="w-100 mb-2", disabled=True), width=12, md=4),
+                             ]),
+                         ])
+                    ]
+                 ),
+                 html.Div(id="loading-output", style={"height": "0px", "visibility": "hidden"}),
+            ]),
+            style={'height': '80vh', 'overflow-y': 'auto', 'position': 'relative'}
+        ), width=12, lg=8),
     ])
 ], fluid=True)
     return final_session_id
 @app.callback(
+    [Output("status", "children"),
+     Output("transcript-preview", "children"),
+     Output("minutes-btn", "disabled"),
+     Output("download-transcript-btn", "disabled"),
+     Output("download-minutes-btn", "disabled"),
+     Output("download-audio-btn", "disabled"),
+     Output("delete-btn", "disabled"),
+     Output("loading-output", "children"),
+     Output("upload-status", "children")],
+    [Input('audio-uploader', 'contents'),
+     Input("minutes-btn", "n_clicks"),
+     Input("delete-btn", "n_clicks")],
+    [State("session-id", "data"),
+     State("model-selection", "value"),
+     State("transcript-preview", "children"),
+     State('audio-uploader', 'filename')],
     prevent_initial_call=True
 )
+def handle_actions(upload_contents, minutes_clicks, delete_clicks, session_id, selected_model, existing_preview, filename):
     if not session_id:
         logging.warning("Session ID missing in handle_actions.")
+        return "Status: Error - Session ID missing", "", True, True, True, True, True, None, "Status: Error"
     ctx = dash.callback_context
     triggered_id = ctx.triggered_id if hasattr(ctx, 'triggered_id') else (ctx.triggered[0]['prop_id'].split('.')[0] if ctx.triggered else None)
     current_transcript = session_data[session_id].get("transcript", "")
     current_minutes = session_data[session_id].get("minutes", "")
     current_audio_path = session_data[session_id].get("audio_path", None)
     original_filename = session_data[session_id].get("original_filename", None)
+    output_text = current_minutes if current_minutes else (current_transcript if current_transcript else "Upload an audio or video file to begin.")
     status_msg = "Status: Idle"
     if current_minutes and "Error:" not in current_minutes:
         status_msg = "Status: Session restored. Minutes loaded."
     elif current_transcript and "Error:" not in current_transcript:
         status_msg = "Status: Session restored. Transcript loaded. Ready for Minutes Generation."
     elif current_audio_path and os.path.exists(current_audio_path):
     dl_minutes_disabled = not bool(current_minutes and "Error:" not in current_minutes)
     dl_audio_disabled = not bool(current_audio_path and os.path.exists(current_audio_path))
     delete_disabled = not bool(session_data.get(session_id, {}).get("temp_dir"))
     loading_output = None
     upload_status_msg = f"Status: {'Loaded: ' + original_filename if original_filename else 'Ready to Upload'}"
     start_time = time.time()
     if triggered_id == 'audio-uploader' and upload_contents is not None and filename is not None:
         logging.info(f"File uploaded for session {session_id}, filename: {filename}")
         session_data[session_id]["original_filename"] = filename
         upload_status_msg = f"Status: Processing Uploaded File ({filename})..."
         status_msg = "Status: Processing Upload..."
         loading_output = "Processing Upload..."
              session_data[session_id]["transcript"] = None
              session_data[session_id]["minutes"] = None
              session_data[session_id]["original_filename"] = None
              minutes_disabled = True
              dl_transcript_disabled = True
              dl_minutes_disabled = True
              dl_audio_disabled = True
              delete_disabled = False
+             return status_msg, output_text, minutes_disabled, dl_transcript_disabled, dl_minutes_disabled, dl_audio_disabled, delete_disabled, None, upload_status_msg
         safe_upload_filename = f"uploaded_file{f_ext}"
         upload_file_path = os.path.join(session_dir, safe_upload_filename)
         saved_upload_path = save_base64_data(upload_contents, upload_file_path)
                     dl_minutes_disabled = True
                     dl_audio_disabled = True
                     delete_disabled = False
+                    return status_msg, output_text, minutes_disabled, dl_transcript_disabled, dl_minutes_disabled, dl_audio_disabled, delete_disabled, None, upload_status_msg
             else:
                 audio_path_for_transcription = saved_upload_path
                 session_data[session_id]["audio_path"] = saved_upload_path
                 transcript_text = transcribe_audio(audio_path_for_transcription)
                 session_data[session_id]["transcript"] = transcript_text
                 session_data[session_id]["minutes"] = None
                 if "Error:" in transcript_text:
                      status_msg = f"Status: Transcription Failed - {transcript_text}"
                      output_text = transcript_text
                      dl_minutes_disabled = True
                      delete_disabled = False
                      upload_status_msg = f"Status: Transcription Failed. ({filename})"
                 else:
                      status_msg = "Status: Transcription Complete. Ready for Minutes Generation."
                      output_text = transcript_text
                      dl_minutes_disabled = True
                      delete_disabled = False
                      upload_status_msg = f"Status: Processed & Transcribed: {filename}"
                 processing_time = time.time() - start_time
                 logging.info(f"File processing and transcription took {processing_time:.2f} seconds for session {session_id}")
         else:
             dl_minutes_disabled = True
             dl_audio_disabled = True
             delete_disabled = False
     elif triggered_id == "minutes-btn" and minutes_clicks:
         logging.info(f"Generate Minutes button clicked for session {session_id}")
+        current_transcript = session_data[session_id].get("transcript", "")
+        if current_transcript and "Error:" not in current_transcript:
             status_msg = f"Status: Generating Minutes ({selected_model})..."
             loading_output = "Generating Minutes..."
+            minutes_text = generate_minutes_ai(current_transcript, selected_model, session_id)
             session_data[session_id]["minutes"] = minutes_text
             output_text = minutes_text
             if "Error:" in minutes_text:
                 status_msg = f"Status: Minutes Generation Failed - {minutes_text}"
                 dl_minutes_disabled = True
             dl_audio_disabled = not bool(session_data.get(session_id, {}).get("audio_path") and os.path.exists(session_data.get(session_id, {}).get("audio_path", "")))
             delete_disabled = False
             upload_status_msg = f"Status: Processed & Transcribed: {session_data[session_id].get('original_filename', 'File')}"
         else:
             status_msg = "Status: Cannot generate minutes - No valid transcript available."
             output_text = existing_preview
             minutes_disabled = True
     elif triggered_id == "delete-btn" and delete_clicks:
         logging.info(f"Delete button clicked for session {session_id}")
         cleanup_session(session_id)
         dl_minutes_disabled = True
         dl_audio_disabled = True
         delete_disabled = True
         upload_status_msg = "Status: Ready to Upload"
     else:
+         loaded_audio_path = session_data.get(session_id, {}).get("audio_path")
+         loaded_transcript = session_data.get(session_id, {}).get("transcript")
+         loaded_minutes = session_data.get(session_id, {}).get("minutes")
+         temp_dir_exists = bool(session_data.get(session_id, {}).get("temp_dir"))
+         loaded_original_filename = session_data.get(session_id, {}).get("original_filename")
+         dl_audio_disabled = not (loaded_audio_path and os.path.exists(loaded_audio_path))
+         minutes_disabled = not (loaded_transcript and "Error:" not in loaded_transcript)
+         dl_transcript_disabled = not (loaded_transcript and "Error:" not in loaded_transcript)
+         dl_minutes_disabled = not (loaded_minutes and "Error:" not in loaded_minutes)
+         delete_disabled = not (loaded_audio_path or loaded_transcript or loaded_minutes or temp_dir_exists or loaded_original_filename)
+         if loaded_original_filename and dl_audio_disabled and not loaded_transcript:
+             upload_status_msg = f"Status: Error processing {loaded_original_filename}?"
+         elif loaded_audio_path and os.path.exists(loaded_audio_path):
+             upload_status_msg = f"Status: Processed audio loaded ({loaded_original_filename or 'previous file'})."
+         else:
+             upload_status_msg = "Status: Ready to Upload"
     return (
         status_msg,
         output_text,
         dl_audio_disabled,
         delete_disabled,
         loading_output,
+        upload_status_msg
     )
 @app.callback(
         logging.error(f"Processed audio file not found at path {audio_path} for session {session_id}")
         return None
 if __name__ == '__main__':
     print("Starting the Dash application...")
+    app.run(debug=False, host='0.0.0.0', port=7860)
     print("Dash application has finished running.")