Spaces:

Princeaka
/

multimodal_module

Running

Princeaka commited on 16 days ago

Commit

0f0d9dc

verified ·

1 Parent(s): 1689753

Update requirements.txt

Files changed (1) hide show

requirements.txt CHANGED Viewed

@@ -1,40 +1,48 @@
 # ===== CORE API =====
-fastapi==0.103.1
-uvicorn==0.23.2
 python-multipart==0.0.6
 python-dotenv==1.0.0
-# ===== AI/ML (COMPATIBLE VERSIONS) =====
-torch==2.1.2 --extra-index-url https://download.pytorch.org/whl/cpu
-transformers==4.37.2
-diffusers==0.26.3
-huggingface-hub==0.20.3
-accelerate==0.27.2
 # ===== AUDIO PROCESSING =====
 soundfile==0.12.1
-librosa==0.10.1
-gTTS==2.4.0
-SpeechRecognition==3.10.0
 pydub==0.25.1
 # ===== IMAGE/VIDEO =====
-Pillow==10.1.0
-imageio[ffmpeg]==2.33.0
-imageio-ffmpeg==0.4.9
 moviepy==1.0.3
-opencv-python-headless==4.8.1.78
 # ===== UTILITIES =====
 langdetect==1.0.9
-pymupdf==1.23.6
-numpy==1.26.3
-tqdm==4.66.1
-requests==2.31.0
 # ===== GRADIO INTERFACE =====
-gradio==4.12.0
-# ===== OPTIONAL =====
-# python-docx==1.1.0 (for DOCX support)
-# scipy==1.11.4 (for advanced audio features)

 # ===== CORE API =====
+fastapi==0.95.2
+uvicorn==0.22.0
 python-multipart==0.0.6
 python-dotenv==1.0.0
+# ===== AI/ML (CORE MODELS) =====
+torch==1.13.1 --extra-index-url https://download.pytorch.org/whl/cpu
+transformers==4.28.1
+diffusers==0.17.1
+huggingface-hub==0.13.4
+accelerate==0.18.0
+sentencepiece==0.1.99  # Required for translation models
 # ===== AUDIO PROCESSING =====
 soundfile==0.12.1
+librosa==0.9.2
+gTTS==2.3.2
+SpeechRecognition==3.8.1
 pydub==0.25.1
+webrtcvad==2.0.10  # Voice activity detection
 # ===== IMAGE/VIDEO =====
+Pillow==9.5.0
+imageio[ffmpeg]==2.31.1
+imageio-ffmpeg==0.4.8
 moviepy==1.0.3
+opencv-python-headless==4.7.0.72
+# ===== DOCUMENT PROCESSING =====
+pymupdf==1.22.5
+python-docx==1.1.0  # For Word files
+pdf2image==1.17.0  # PDF to image conversion
 # ===== UTILITIES =====
+numpy==1.23.5
+tqdm==4.65.0
+requests==2.28.2
 langdetect==1.0.9
+protobuf==3.20.3  # Required for some Hugging Face models
 # ===== GRADIO INTERFACE =====
+gradio==3.41.0
+# ===== OPTIONAL (UNCOMMENT IF NEEDED) =====
+# scipy==1.10.1  # Advanced audio features
+# pandas==1.5.3   # For CSV processing
+# openai-whisper==20230314  # Alternative speech recognition