Spaces:

reab5555
/

Multiple-Speakers-Personality-Analyzer

Runtime error

App Files Files Community

reab5555 commited on Aug 5, 2024

Commit

0dfd8b5

verified ·

1 Parent(s): 3b48e31

Update processing.py

Browse files

Files changed (1) hide show

processing.py +3 -10

processing.py CHANGED Viewed

@@ -2,10 +2,9 @@ import os
 import torch
 import math
 import time
-import shutil
 from moviepy.editor import VideoFileClip
 from pyannote.audio import Pipeline
-from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline, AutoTokenizer
 import librosa
 import datetime
 from collections import defaultdict
@@ -305,24 +304,18 @@ def process_input(input_file, progress=None):
     if file_extension == '.txt':
         with open(input_file.name, 'r', encoding='utf-8') as file:
             content = file.read()
-        words, tokens = count_words_and_tokens(content)
-        input_info = f"Text file processed. Words: {words}, Tokens: {tokens}"
     elif file_extension == '.pdf':
         loader = PyPDFLoader(input_file.name)
         pages = loader.load_and_split()
         content = '\n'.join([page.page_content for page in pages])
-        words, tokens = count_words_and_tokens(content)
-        input_info = f"PDF file processed. Words: {words}, Tokens: {tokens}"
     elif file_extension in ['.mp4', '.avi', '.mov']:
         safe_progress(0.2, desc="Processing video...")
         srt_path = process_video(input_file.name, os.environ.get('hf_secret'), "en")
         with open(srt_path, 'r', encoding='utf-8') as file:
             content = file.read()
-        words, tokens = count_words_and_tokens(content)
-        input_info = f"Video processed. Words: {words}, Tokens: {tokens}"
         os.remove(srt_path)
     else:
-        return "Unsupported file format. Please upload a TXT, PDF, or video file.", None, None, None, None, None, None
     detected_language = detect_language(content)
@@ -337,5 +330,5 @@ def process_input(input_file, progress=None):
     safe_progress(1.0, desc="Analysis complete!")
-    return ("Analysis complete!", execution_info, detected_language, input_info,
             attachments_answer, bigfive_answer, personalities_answer)

 import torch
 import math
 import time
 from moviepy.editor import VideoFileClip
 from pyannote.audio import Pipeline
+from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline, AutoTokenizer, AutoModelForCausalLM
 import librosa
 import datetime
 from collections import defaultdict
     if file_extension == '.txt':
         with open(input_file.name, 'r', encoding='utf-8') as file:
             content = file.read()
     elif file_extension == '.pdf':
         loader = PyPDFLoader(input_file.name)
         pages = loader.load_and_split()
         content = '\n'.join([page.page_content for page in pages])
     elif file_extension in ['.mp4', '.avi', '.mov']:
         safe_progress(0.2, desc="Processing video...")
         srt_path = process_video(input_file.name, os.environ.get('hf_secret'), "en")
         with open(srt_path, 'r', encoding='utf-8') as file:
             content = file.read()
         os.remove(srt_path)
     else:
+        return "Unsupported file format. Please upload a TXT, PDF, or video file.", None, None, None, None, None
     detected_language = detect_language(content)
     safe_progress(1.0, desc="Analysis complete!")
+    return ("Analysis complete!", execution_info, detected_language,
             attachments_answer, bigfive_answer, personalities_answer)