whisper-tg

Paused

App Files Files Community

muhtasham commited on Mar 24

Commit

0cc77b1

1 Parent(s): 2ed924a

WIP

Browse files

Files changed (1) hide show

app.py +15 -25

app.py CHANGED Viewed

@@ -248,22 +248,17 @@ def transcribe_youtube(url, return_timestamps, generate_subs, chunk_length_s=30,
             logger.error(f"Invalid audio URL scheme from Sieve: {audio_url}")
             raise gr.Error("Invalid audio URL scheme received from Sieve")
-        # Prepare request parameters
-        params = {
-            "source_language": "tg",  # Tajik language
-            "timestamp_level": "sentence" if return_timestamps else None,
-            "task": "transcribe",
-            "chunk_length_s": chunk_length_s,
-            "batch_size": batch_size
-        }
-        logger.info(f"Prepared API request parameters: {params}")
         # Send request to API
         logger.info("Sending transcription request to API...")
         response = requests.post(
             f"{API_URL}/transcribe/url",
-            json={"url": audio_url},
-            params=params,
             timeout=1800
         )
         response.raise_for_status()
@@ -324,22 +319,17 @@ def transcribe(inputs, return_timestamps, generate_subs, chunk_length_s=30, batc
         with open(inputs, "rb") as f:
             files = {"file": f}
-            # Prepare request parameters
-            params = {
-                "source_language": "tg",  # Tajik language
-                "timestamp_level": "sentence" if return_timestamps else None,
-                "task": "transcribe",
-                "chunk_length_s": chunk_length_s,
-                "batch_size": batch_size
-            }
-            logger.info(f"Prepared API request parameters: {params}")
             # Send request to API
             logger.info("Sending transcription request to API...")
             response = requests.post(
                 f"{API_URL}/transcribe",
                 files=files,
-                params=params,
                 timeout=1800
             )
             response.raise_for_status()
@@ -418,7 +408,7 @@ mf_transcribe = gr.Interface(
         gr.Audio(sources="microphone", type="filepath"),
         gr.Checkbox(label="Include timestamps", value=True),
         gr.Checkbox(label="Generate subtitles", value=True),
-        gr.Slider(minimum=10, maximum=60, value=30, step=5, label="Chunk Length (seconds)"),
         gr.Slider(minimum=32, maximum=256, value=128, step=32, label="Batch Size")
     ],
     outputs=[
@@ -439,7 +429,7 @@ file_transcribe = gr.Interface(
         gr.Audio(sources="upload", type="filepath", label="Audio file"),
         gr.Checkbox(label="Include timestamps", value=True),
         gr.Checkbox(label="Generate subtitles", value=True),
-        gr.Slider(minimum=10, maximum=60, value=15, step=5, label="Chunk Length (seconds)"),
         gr.Slider(minimum=32, maximum=256, value=8, step=32, label="Batch Size")
     ],
     outputs=[

             logger.error(f"Invalid audio URL scheme from Sieve: {audio_url}")
             raise gr.Error("Invalid audio URL scheme received from Sieve")
         # Send request to API
         logger.info("Sending transcription request to API...")
         response = requests.post(
             f"{API_URL}/transcribe/url",
+            json={
+                "url": audio_url,
+                "timestamp_level": "sentence" if return_timestamps else None,
+                "task": "transcribe",
+                "chunk_length_s": chunk_length_s,
+                "batch_size": batch_size
+            },
             timeout=1800
         )
         response.raise_for_status()
         with open(inputs, "rb") as f:
             files = {"file": f}
             # Send request to API
             logger.info("Sending transcription request to API...")
             response = requests.post(
                 f"{API_URL}/transcribe",
                 files=files,
+                data={
+                    "timestamp_level": "sentence" if return_timestamps else None,
+                    "task": "transcribe",
+                    "chunk_length_s": chunk_length_s,  # Send as integer
+                    "batch_size": batch_size  # Send as integer
+                },
                 timeout=1800
             )
             response.raise_for_status()
         gr.Audio(sources="microphone", type="filepath"),
         gr.Checkbox(label="Include timestamps", value=True),
         gr.Checkbox(label="Generate subtitles", value=True),
+        gr.Slider(minimum=10, maximum=30, value=30, step=5, label="Chunk Length (seconds)"),
         gr.Slider(minimum=32, maximum=256, value=128, step=32, label="Batch Size")
     ],
     outputs=[
         gr.Audio(sources="upload", type="filepath", label="Audio file"),
         gr.Checkbox(label="Include timestamps", value=True),
         gr.Checkbox(label="Generate subtitles", value=True),
+        gr.Slider(minimum=10, maximum=30, value=15, step=5, label="Chunk Length (seconds)"),
         gr.Slider(minimum=32, maximum=256, value=8, step=32, label="Batch Size")
     ],
     outputs=[