Spaces:

EnDevSols
/

ASR-Arabic

Sleeping

App Files Files Community

muzammil-eds commited on Sep 5, 2024

Commit

8b6c021

verified ·

1 Parent(s): 18922c4

Update app.py

Browse files

Files changed (1) hide show

app.py +48 -23

app.py CHANGED Viewed

@@ -40,27 +40,41 @@ def evaluate_audio_similarity(original_audio_bytes, user_audio_bytes):
 st.title("Audio Transcription and Similarity Checker")
-# Choose between upload or record
-st.sidebar.header("Input Method")
-input_method = st.sidebar.selectbox("Choose Input Method", ["Record"])
-original_audio_bytes = None
-user_audio_bytes = None
-# Delay for initial setup to avoid first-click auto-stop issue
-if input_method == "Record":
-    st.write("Record or Upload Original Audio")
-    # Introducing a delay for initial recording setup to avoid immediate stop issue
-    if 'initialized' not in st.session_state:
-        st.session_state['initialized'] = False
-    if not st.session_state['initialized']:
         st.session_state['initialized'] = True
-        st.warning("Initializing recorder... Please wait a moment.")
-        time.sleep(2)  # Add small delay before first-time recording
-    else:
-        original_audio_bytes = audio_recorder(key="original_audio_recorder", pause_threshold=30, icon_size='4x')
     if not original_audio_bytes:
         original_audio = st.file_uploader("Or Upload Original Audio", type=["wav", "mp3"])
@@ -71,8 +85,19 @@ if input_method == "Record":
         with st.spinner("Processing original audio..."):
             st.audio(original_audio_bytes, format="audio/wav")
-    st.write("Record or Upload User Audio")
-    user_audio_bytes = audio_recorder(key="user_audio_recorder", pause_threshold=30, icon_size='4x')
     if not user_audio_bytes:
         user_audio = st.file_uploader("Or Upload User Audio", type=["wav", "mp3"])
@@ -96,7 +121,7 @@ if input_method == "Record":
                 st.write(f"**User Transcription:** {transcription_user}")
                 st.write(f"**Levenshtein Similarity Score:** {similarity_score:.2f}")
-                if similarity_score > 0.8:
                     st.success("The pronunciation is likely correct based on transcription similarity.")
                 else:
                     st.error("The pronunciation may be incorrect based on transcription similarity.")

 st.title("Audio Transcription and Similarity Checker")
+# Initialize the session state to control the view
+if 'initialized' not in st.session_state:
+    st.session_state['initialized'] = False
+# Button to initialize the recorders
+if not st.session_state['initialized']:
+    st.write("Click the Loader below to initialize the audio recorders.")
+    if st.button('Click to start recording'):
+        init_button = audio_recorder(
+            text="",
+            recording_color="#e8b62c",
+            neutral_color="#6aa36f",
+            pause_threshold=0.1,
+            icon_name="",  # You can change this to any Font Awesome solid icon
+            icon_size="4x",
+            auto_start=True
+        )
         st.session_state['initialized'] = True
+# If initialized, display the recorders
+if st.session_state['initialized']:
+    st.subheader("Record or Upload Original Audio")
+    # Style the record button with the provided parameters
+    original_audio_bytes = audio_recorder(
+        text="Click to Record Audio",
+        recording_color="#e8b62c",
+        neutral_color="#6aa36f",
+        pause_threshold=30,
+        icon_name="microphone",  # You can change this to any Font Awesome solid icon
+        icon_size="4x"
+    )
     if not original_audio_bytes:
         original_audio = st.file_uploader("Or Upload Original Audio", type=["wav", "mp3"])
         with st.spinner("Processing original audio..."):
             st.audio(original_audio_bytes, format="audio/wav")
+    st.subheader("Record or Upload User Audio")
+    st.write("")
+    # Style the user audio recorder similarly
+    user_audio_bytes = audio_recorder(
+        text="Click to Record Audio",
+        recording_color="#e86f6f",
+        neutral_color="#6a6faf",
+        pause_threshold=30,
+        icon_name="user",  # You can change this to any Font Awesome solid icon
+        icon_size="4x"
+    )
     if not user_audio_bytes:
         user_audio = st.file_uploader("Or Upload User Audio", type=["wav", "mp3"])
                 st.write(f"**User Transcription:** {transcription_user}")
                 st.write(f"**Levenshtein Similarity Score:** {similarity_score:.2f}")
+                if similarity_score > 0.8:  # Adjust the threshold as needed
                     st.success("The pronunciation is likely correct based on transcription similarity.")
                 else:
                     st.error("The pronunciation may be incorrect based on transcription similarity.")