Spaces:

camparchimedes
/

nb

Build error

App Files Files

camparchimedes commited on Aug 12, 2024

Commit

f790049

verified ·

1 Parent(s): 1c07b23

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -13

app.py CHANGED Viewed

@@ -1,11 +1,3 @@
-#             -----------------COPY OF NEW EDITION[app.py]-----------------
-# check if still the case...........??*********************************************
-# "The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results."
 import time
 import os
 import spaces
@@ -39,7 +31,7 @@ if processor.tokenizer.eos_token_id is None:
 pipe = pipeline("automatic-speech-recognition", model="NbAiLabBeta/nb-whisper-large", torch_dtype=torch_dtype)
 #language = "no"
-task = "transcribe"
 def transcribe_audio(audio_file):
     if audio_file.endswith(".m4a"):
@@ -52,7 +44,7 @@ def transcribe_audio(audio_file):
             audio_file,
             chunk_length_s=30,
             generate_kwargs={
-                "task": task,
                 "pad_token_id": processor.tokenizer.pad_token_id,
                 "eos_token_id": processor.tokenizer.eos_token_id
             }
@@ -190,13 +182,14 @@ def text_rank_summary(text, num_paragraphs=3):
     summary = [ranked_sentences[i][1] for i in range(num_paragraphs)] # top sentences for summary
     return ' '.join(summary)
 banner_html = """
 <div style="text-align: center;">
-    <img src="https://huggingface.co/spaces/camparchimedes/transcription_app/raw/main/picture.png" alt="" width="100%" height="auto">
 </div>
 """
-# https://raw.githubusercontent.com/camparchimedes/sw-llm/main/annex/cooltext462376124862020.png
 import gradio as gr

 import time
 import os
 import spaces
 pipe = pipeline("automatic-speech-recognition", model="NbAiLabBeta/nb-whisper-large", torch_dtype=torch_dtype)
 #language = "no"
+# task = "transcribe"
 def transcribe_audio(audio_file):
     if audio_file.endswith(".m4a"):
             audio_file,
             chunk_length_s=30,
             generate_kwargs={
+                # "task": task,
                 "pad_token_id": processor.tokenizer.pad_token_id,
                 "eos_token_id": processor.tokenizer.eos_token_id
             }
     summary = [ranked_sentences[i][1] for i in range(num_paragraphs)] # top sentences for summary
     return ' '.join(summary)
 banner_html = """
 <div style="text-align: center;">
+    <img src="https://raw.huggingface.co/spaces/camparchimedes/transcription_app/blob/main/banner_trans.png
+" alt="" width="100%" height="auto">
 </div>
 """
+# https://raw.huggingface.co/spaces/camparchimedes/transcription_app/blob/main/banner_trans.png
 import gradio as gr