Spaces:

davidanthony-ai
/

digitalixsa_transcription

Sleeping

App Files Files Community

David_A commited on Jun 25, 2023

Commit

880278b

1 Parent(s): 3920614

tempfile use

Browse files

Files changed (3) hide show

components/fonctions_transcription.py +29 -10
pages/Transcription.py +5 -3
requirements.txt +2 -0

components/fonctions_transcription.py CHANGED Viewed

@@ -8,6 +8,8 @@ from datetime import timedelta as td
 import math
 import pandas as pd
 import plotly.express as px
 # # Chargement du fichier des utilisateurs
 # with open("users_info.json", 'r') as file:
@@ -152,6 +154,20 @@ def transcript(dict_user,username,user_group, audio_file,maintenant,Year_Month,q
     # Calcul consommation utilisateur
     figure , consommation = graphique_utilisation(dict_user, username, Year_Month)
     if audio_file is not None:
         st.sidebar.header("Ecouter le fichier audio")
         st.sidebar.audio(audio_file)
@@ -175,12 +191,15 @@ def transcript(dict_user,username,user_group, audio_file,maintenant,Year_Month,q
                 else :
                     ### Durée de l'audio ###
                     # Charger le fichier audio et obtenir les informations
-                    print(audio_file.name)
-                    infos_audio = sf.info(audio_file.name)
                     # Extraire la durée en secondes
-                    duree_audio_sec = infos_audio.duration
                     # Afficher la durée
-                    print(f'Durée audio : {duree_audio_sec} secondes')
                     # Mise à jour info utilisateurs
                     dict_user[username]["durees_audio_sec"].append(duree_audio_sec)
@@ -189,7 +208,7 @@ def transcript(dict_user,username,user_group, audio_file,maintenant,Year_Month,q
                         json.dump(dict_user, f)
                     st.sidebar.success("Audio en cours de transcription")
                     audio_name = audio_file.name
-                    transcription = model.transcribe(audio_name)
                     st.sidebar.success("Transcription terminée")
                     st.balloons()
                     text_transcript = transcription["text"]
@@ -234,12 +253,12 @@ def transcript(dict_user,username,user_group, audio_file,maintenant,Year_Month,q
                 ### Durée de l'audio ###
                 # Charger le fichier audio et obtenir les informations
                 #print(audio_file.name)
-                print(sf.__version__)
-                infos_audio = sf.info(audio_file.name)
                 # Extraire la durée en secondes
-                duree_audio_sec = infos_audio.duration
                 # Afficher la durée
-                print(f'Durée audio : {duree_audio_sec} secondes')
                 # Mise à jour info utilisateurs
                 dict_user[username]["durees_audio_sec"].append(duree_audio_sec)
@@ -248,7 +267,7 @@ def transcript(dict_user,username,user_group, audio_file,maintenant,Year_Month,q
                     json.dump(dict_user, f)
                 st.sidebar.success("Audio en cours de transcription")
                 audio_name = audio_file.name
-                transcription = model.transcribe(audio_name)
                 st.sidebar.success("Transcription terminée")
                 st.balloons()
                 text_transcript = transcription["text"]

 import math
 import pandas as pd
 import plotly.express as px
+from pydub import AudioSegment
+import tempfile
 # # Chargement du fichier des utilisateurs
 # with open("users_info.json", 'r') as file:
     # Calcul consommation utilisateur
     figure , consommation = graphique_utilisation(dict_user, username, Year_Month)
     if audio_file is not None:
+        # Créer un fichier temporaire
+        with tempfile.NamedTemporaryFile(delete=False) as temp_file:
+            temp_filename = temp_file.name
+            # Écrire les données du fichier téléchargé dans le fichier temporaire
+            temp_file.write(audio_file.read())
+             # Afficher le chemin du fichier temporaire
+            #st.success(f'Fichier enregistré : {temp_filename}')
+            infos_audio = sf.info(temp_filename)
+            # Extraire la durée en secondes
+            duree_audio_sec = infos_audio.duration
+            print(duree_audio_sec)
         st.sidebar.header("Ecouter le fichier audio")
         st.sidebar.audio(audio_file)
                 else :
                     ### Durée de l'audio ###
                     # Charger le fichier audio et obtenir les informations
+                    #print(audio_file.name)
+                    #infos_audio = sf.info(audio_file.name)
                     # Extraire la durée en secondes
+                    #duree_audio_sec = infos_audio.duration
+                    #duree_audio_sec = infos_audio.duration
                     # Afficher la durée
+                    #print(f'Durée audio : {duree_audio_sec} secondes')
                     # Mise à jour info utilisateurs
                     dict_user[username]["durees_audio_sec"].append(duree_audio_sec)
                         json.dump(dict_user, f)
                     st.sidebar.success("Audio en cours de transcription")
                     audio_name = audio_file.name
+                    transcription = model.transcribe(temp_filename)
                     st.sidebar.success("Transcription terminée")
                     st.balloons()
                     text_transcript = transcription["text"]
                 ### Durée de l'audio ###
                 # Charger le fichier audio et obtenir les informations
                 #print(audio_file.name)
+                #print(sf.__version__)
+                #infos_audio = sf.info(audio_file.name)
                 # Extraire la durée en secondes
+                #duree_audio_sec = infos_audio.duration
                 # Afficher la durée
+                #print(f'Durée audio : {duree_audio_sec} secondes')
                 # Mise à jour info utilisateurs
                 dict_user[username]["durees_audio_sec"].append(duree_audio_sec)
                     json.dump(dict_user, f)
                 st.sidebar.success("Audio en cours de transcription")
                 audio_name = audio_file.name
+                transcription = model.transcribe(temp_filename)
                 st.sidebar.success("Transcription terminée")
                 st.balloons()
                 text_transcript = transcription["text"]

pages/Transcription.py CHANGED Viewed

@@ -68,12 +68,14 @@ if st.session_state["authenticated"]:
         #print("User Pool ID:", user_pool_id)
         #authenticate.add_user_to_group(user_pool_id, username, group_name)
         #Charger l'audio avec streamlit
-    audio_file = st.file_uploader("Charger l'audio", type=["wav", "mp3", "m4a"])
-    #audio_name = audio_file.name
     # Chargement du modèle
     model = whisper.load_model("medium")
     st.text("Chargement du modèle terminé")
     #Definition quota utilisation

         #print("User Pool ID:", user_pool_id)
         #authenticate.add_user_to_group(user_pool_id, username, group_name)
         #Charger l'audio avec streamlit
     # Chargement du modèle
     model = whisper.load_model("medium")
     st.text("Chargement du modèle terminé")
+    audio_file = st.file_uploader("Charger l'audio", type=["wav", "mp3", "m4a"])
+    #audio_name = audio_file.name
     #Definition quota utilisation

requirements.txt CHANGED Viewed

@@ -8,3 +8,5 @@ plotly.express
 nbformat>=4.2.0
 boto3
 soundfile == 0.12.1

 nbformat>=4.2.0
 boto3
 soundfile == 0.12.1
+pydub
+tempfile