File size: 671 Bytes
0ccad8d
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

import os
os.makedirs("modelos", exist_ok=True)
from preprocesamiento import cargar_datos, procesar_texto, dividir_datos
from sklearn.feature_extraction.text import CountVectorizer
from analisis import entrenar_modelos, evaluar_modelos, guardar_modelo

df = cargar_datos("datos/opiniones.csv")
df['opinion'] = procesar_texto(df['opinion'])

X_train, X_test, y_train, y_test = dividir_datos(df)
vectorizer = CountVectorizer()

modelos = entrenar_modelos(X_train, y_train, vectorizer)
evaluar_modelos(modelos, X_test, y_test)

guardar_modelo(modelos["Regresión Logística"], "modelos/modelo_supervisado.pkl")
guardar_modelo(vectorizer, "modelos/modelo_vectorizador.pkl")