Spaces:

Adjoumani
/

UnifySummarizer

Sleeping

App Files Files Community

Adjoumani commited on Jan 8

Commit

adec459

verified ·

1 Parent(s): 86321f2

Update app.py

Browse files

Files changed (1) hide show

app.py +4 -97

app.py CHANGED Viewed

@@ -455,60 +455,7 @@ class VideoProcessor:
             raise RuntimeError(f"Erreur lors du téléchargement : {str(e)}")
-    """def download_youtube_audio(self, url: str) -> str:
-        try:
-            # Définir le chemin vers le fichier cookies
-            cookie_file_path = "cookies.txt"  # Assurez-vous que le fichier est dans le bon dossier
-            # Chemin de sortie pour l'audio
-            audio_file_path = "temp_audio.mp3"
-            # Options pour yt-dlp
-            ydl_opts = {
-                'format': 'bestaudio/best',
-                'postprocessors': [{
-                    'key': 'FFmpegExtractAudio',
-                    'preferredcodec': 'mp3',
-                    'preferredquality': '192',
-                }],
-                'outtmpl': audio_file_path,  # Fichier de sortie
-                'cookiefile': cookie_file_path  # Utilisation du fichier de cookies
-            }
-            # Téléchargement de l'audio
-            with yt_dlp.YoutubeDL(ydl_opts) as ydl:
-                ydl.download([url])
-            # Retourner le chemin du fichier téléchargé
-            return audio_file_path
-        except Exception as e:
-            raise RuntimeError(f"Erreur lors du téléchargement : {str(e)}")"""
-    """def download_youtube_audio(self, url: str) -> str:
-    """
-        #Télécharge une vidéo YouTube en utilisant les cookies du navigateur.
-    """
-        ydl_opts = {
-            'cookiesfrombrowser': ('chrome',),  # Utilise Chromium pour les cookies
-            'format': 'bestaudio/best',
-            'postprocessors': [
-                {
-                    'key': 'FFmpegExtractAudio',
-                    'preferredcodec': 'mp3',
-                }
-            ],
-            'outtmpl': 'temp_audio_with_cookies.%(ext)s'
-        }
-        try:
-            with yt_dlp.YoutubeDL(ydl_opts) as ydl:
-                ydl.download([url])
-            return 'temp_audio_with_cookies.mp3'
-        except Exception as e:
-            st.error(f"Erreur lors du téléchargement de la vidéo avec cookies : {str(e)}")
-            raise
-    """
     def extract_audio_from_video(self, video_path: str) -> str:
         try:
@@ -525,7 +472,7 @@ class DocumentProcessor:
         self.llm = ChatGroq(
             model=model_name,
             temperature=0,
-            api_key=Config.GROQ_API_KEY
         )
         self.custom_prompt = prompt
         #self.text_splitter = RecursiveCharacterTextSplitter(
@@ -552,7 +499,7 @@ class DocumentProcessor:
         """Traduit le texte en français si nécessaire"""
         try:
             messages = [
-                SystemMessage(content="Vous êtes un traducteur professionnel. Traduisez le texte suivant en français en conservant le format et la structure:"),
                 HumanMessage(content=text)
             ]
             result = self._make_api_call(messages)
@@ -651,23 +598,7 @@ class DocumentProcessor:
         except Exception as e:
             raise RuntimeError(f"Erreur lors du traitement du fichier Office : {e}")
-    """def process_protected_office(self, file, password: str=None, file_type: str) -> str:
-        try:
-            office_file = msoffcrypto.OfficeFile(file)
-            office_file.load_key(password=password)
-            decrypted = io.BytesIO()
-            office_file.decrypt(decrypted)
-            if file_type == 'docx':
-                doc = docx.Document(decrypted)
-                return "\n".join([p.text for p in doc.paragraphs])
-            elif file_type == 'pptx':
-                ppt = pptx.Presentation(decrypted)
-                return "\n".join([shape.text for slide in ppt.slides
-                                for shape in slide.shapes if hasattr(shape, "text")])
-        except Exception:
-            raise ValueError("Mot de passe document incorrect")"""
     def scrape_web_content(self, url: str, auth: Dict[str, str] = None) -> str:
         try:
@@ -747,31 +678,7 @@ class DocumentProcessor:
               time.sleep(60)
               return self.summarize_long_transcription(transcription)
           raise e
-    """def summarize_text(self, text: str) -> str:
-        try:
-            chunks = self.text_splitter.split_text(text)
-            summaries = []
-            for chunk in chunks:
-                messages = [
-                    SystemMessage(content="Générez un résumé en français de ce texte:"),
-                    HumanMessage(content=chunk)
-                ]
-                summary = self._make_api_call(messages).generations[0][0].text
-                summaries.append(summary)
-            if len(summaries) > 1:
-                final_messages = [
-                    SystemMessage(content="Combinez ces résum��s en un résumé cohérent en français:"),
-                    HumanMessage(content="\n".join(summaries))
-                ]
-                final_summary = self._make_api_call(final_messages).generations[0][0].text
-                return final_summary
-            return summaries[0]
-        except Exception as e:
-            raise ValueError(f"Erreur de traitement: {str(e)}")"""
 def generate_docx(content: str, filename: str):
     doc = Document()

             raise RuntimeError(f"Erreur lors du téléchargement : {str(e)}")
     def extract_audio_from_video(self, video_path: str) -> str:
         try:
         self.llm = ChatGroq(
             model=model_name,
             temperature=0,
+            #api_key=Config.GROQ_API_KEY
         )
         self.custom_prompt = prompt
         #self.text_splitter = RecursiveCharacterTextSplitter(
         """Traduit le texte en français si nécessaire"""
         try:
             messages = [
+                SystemMessage(content="Vous êtes un traducteur professionnel agrée en Français. Traduisez le texte suivant en français en conservant le format et la structure:"),
                 HumanMessage(content=text)
             ]
             result = self._make_api_call(messages)
         except Exception as e:
             raise RuntimeError(f"Erreur lors du traitement du fichier Office : {e}")
     def scrape_web_content(self, url: str, auth: Dict[str, str] = None) -> str:
         try:
               time.sleep(60)
               return self.summarize_long_transcription(transcription)
           raise e
 def generate_docx(content: str, filename: str):
     doc = Document()