Update requirements.txt
Browse files- requirements.txt +25 -12
requirements.txt
CHANGED
@@ -1,22 +1,35 @@
|
|
1 |
-
# Core
|
2 |
-
torch>=2.0.0
|
3 |
-
transformers>=4.30.0
|
4 |
-
|
|
|
|
|
|
|
5 |
|
6 |
# PDF Processing
|
7 |
-
PyMuPDF>=1.22.3 #
|
8 |
-
PyPDF2>=3.0.0 #
|
|
|
9 |
|
10 |
-
# NLP
|
11 |
nltk>=3.8.1
|
12 |
regex>=2023.5.5
|
13 |
|
14 |
-
#
|
|
|
15 |
tqdm>=4.65.0
|
16 |
-
typing>=3.7.4.3
|
17 |
numpy>=1.24.0
|
18 |
pandas>=2.0.0
|
19 |
|
20 |
-
#
|
21 |
-
|
22 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# Core ML/DL
|
2 |
+
torch>=2.0.0,<3.0.0
|
3 |
+
transformers>=4.30.0,<5.0.0
|
4 |
+
sentencepiece>=0.1.99 # Necessário para alguns modelos
|
5 |
+
|
6 |
+
# Interface
|
7 |
+
gradio>=3.50.0,<4.0.0
|
8 |
|
9 |
# PDF Processing
|
10 |
+
PyMuPDF>=1.22.3 # Principal extrator de PDF
|
11 |
+
PyPDF2>=3.0.0 # Extrator de backup
|
12 |
+
python-magic>=0.4.27 # Detecção de tipo de arquivo
|
13 |
|
14 |
+
# NLP
|
15 |
nltk>=3.8.1
|
16 |
regex>=2023.5.5
|
17 |
|
18 |
+
# Tipos e Utilidades
|
19 |
+
typing-extensions>=4.7.1
|
20 |
tqdm>=4.65.0
|
|
|
21 |
numpy>=1.24.0
|
22 |
pandas>=2.0.0
|
23 |
|
24 |
+
# Performance e Otimização
|
25 |
+
concurrent-futures>=3.0.5
|
26 |
+
psutil>=5.9.0 # Monitoramento de recursos
|
27 |
+
|
28 |
+
# Logging e Debug
|
29 |
+
rich>=13.3.5 # Formatação de logs
|
30 |
+
python-json-logger>=2.0.7
|
31 |
+
|
32 |
+
# Opcional (descomente se necessário)
|
33 |
+
# scikit-learn>=1.2.0 # Para processamento de texto adicional
|
34 |
+
# scipy>=1.10.0 # Para cálculos científicos
|
35 |
+
# python-Levenshtein>=0.21.0 # Para comparação de strings
|