Spaces:

jeysshon
/

Soph-IA

Sleeping

App Files Files Community

jeysshon commited on Sep 7, 2024

Commit

58947a2

verified ·

1 Parent(s): 5de271e

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -51

app.py CHANGED Viewed

@@ -1,12 +1,11 @@
 import streamlit as st
 from PIL import Image
-import speech_recognition as sr
 import google.generativeai as genai
 from gtts import gTTS
 import os
 # Configuración de la página de Streamlit
-st.set_page_config(layout="wide")
 # Configuración de la API key para Google Generative AI
 api_key = "AIzaSyDJZ3r6VRhRivR0pb96cBRg_VvGg_fXq5k"  # API key proporcionada
@@ -14,46 +13,25 @@ api_key = "AIzaSyDJZ3r6VRhRivR0pb96cBRg_VvGg_fXq5k"  # API key proporcionada
 def procesar_texto(texto):
     genai.configure(api_key=api_key)
     modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
-    try:
-        respuesta = modelo.generate_content(texto)
-        return respuesta.text
-    except Exception as e:
-        st.error(f"Error al procesar el texto: {str(e)}")
-        return "No se pudo generar una respuesta."
 def procesar_imagen(imagen):
     genai.configure(api_key=api_key)
     modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
-    try:
-        respuesta = modelo.generate_content(imagen.name)  # Ajusta según la API
-        return respuesta.text
-    except Exception as e:
-        st.error(f"Error al procesar la imagen: {str(e)}")
-        return "No se pudo procesar la imagen."
-def reconocer_voz():
-    reconocedor = sr.Recognizer()
-    try:
-        with sr.Microphone() as fuente:
-            st.write("Escuchando...")
-            audio = reconocedor.listen(fuente)
-            texto = reconocedor.recognize_google(audio)
-            return texto
-    except sr.UnknownValueError:
-        return "El reconocimiento de voz de Google no pudo entender el audio."
-    except sr.RequestError as e:
-        return f"No se pudieron solicitar resultados del servicio de reconocimiento de voz de Google; {e}"
 def hablar_texto(texto):
-    tts = gTTS(text=texto, lang='es')
-    archivo_audio = "respuesta.mp3"
     try:
-        tts.save(archivo_audio)
-        os.system(f"mpg321 {archivo_audio}")  # Puedes usar otro reproductor como afplay en macOS o VLC
     except Exception as e:
-        st.error(f"Error al generar audio: {str(e)}")
-st.title("🤖 ChatBot")
 espacio_contenido_generado = st.empty()
@@ -62,19 +40,21 @@ with open("./style.css") as f:
     st.markdown(f"<style>{f.read()}</style>", unsafe_allow_html=True)
 # Contenido principal
 col1, col2 = st.columns([1, 3])
 with col1:
-    tipo_entrada = st.selectbox("Selecciona el tipo de entrada", ["Haz una pregunta❓", "🖼️ Subir imagen", "🎤 Usar micrófono"])
 with col2:
-    if tipo_entrada == "Haz una pregunta❓":
-        entrada_texto = st.text_input("Ingresa tu pregunta aquí")
         if entrada_texto:
             with st.spinner("Generando respuesta..."):
                 resultado = procesar_texto(entrada_texto)
-            espacio_contenido_generado.write(resultado)
-            if st.button("🔊 Hablar", key="hablar_entrada_texto"):
                 hablar_texto(resultado)
     elif tipo_entrada == "🖼️ Subir imagen":
@@ -84,17 +64,7 @@ with col2:
             st.image(imagen, caption='Imagen subida.', use_column_width=True)
             with st.spinner("Procesando imagen..."):
                 respuesta = procesar_imagen(entrada_imagen)
-            espacio_contenido_generado.write(respuesta)
-    elif tipo_entrada == "🎤 Usar micrófono":
-        if st.button("Grabar"):
-            with st.spinner("Escuchando y procesando..."):
-                texto_de_voz = reconocer_voz()
-            if texto_de_voz:
-                entrada_texto = st.text_input("Habla", value=texto_de_voz)
-                if entrada_texto:
-                    with st.spinner("Generando respuesta..."):
-                        resultado = procesar_texto(entrada_texto)
-                    espacio_contenido_generado.write(resultado)
-                    if st.button("🔊 Hablar", key="hablar_entrada_voz"):
-                        hablar_texto(resultado)

 import streamlit as st
 from PIL import Image
 import google.generativeai as genai
 from gtts import gTTS
 import os
 # Configuración de la página de Streamlit
+st.set_page_config(page_title="🤖 ChatBot", layout="wide")
 # Configuración de la API key para Google Generative AI
 api_key = "AIzaSyDJZ3r6VRhRivR0pb96cBRg_VvGg_fXq5k"  # API key proporcionada
 def procesar_texto(texto):
     genai.configure(api_key=api_key)
     modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
+    respuesta = modelo.generate_content(texto)
+    return respuesta.text
 def procesar_imagen(imagen):
     genai.configure(api_key=api_key)
     modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
+    # Procesa la imagen como un archivo binario
+    respuesta = modelo.generate_content(imagen.read())
+    return respuesta.text
 def hablar_texto(texto):
     try:
+        tts = gTTS(text=texto, lang='es')
+        tts.save("respuesta.mp3")
+        os.system("mpg321 respuesta.mp3")  # Usa mpg321 para reproducir el archivo
     except Exception as e:
+        st.error(f"Error al generar el audio: {e}")
+st.title("🤖 ¡Bienvenido a ChatBot!")
 espacio_contenido_generado = st.empty()
     st.markdown(f"<style>{f.read()}</style>", unsafe_allow_html=True)
 # Contenido principal
+st.write("¡Hola! Soy tu asistente virtual. ¿Cómo puedo ayudarte hoy? 😊")
 col1, col2 = st.columns([1, 3])
 with col1:
+    tipo_entrada = st.selectbox("Selecciona el tipo de entrada", ["Haz una pregunta ❓", "🖼️ Subir imagen"])
 with col2:
+    if tipo_entrada == "Haz una pregunta ❓":
+        entrada_texto = st.text_input("Ingresa tu pregunta aquí:")
         if entrada_texto:
             with st.spinner("Generando respuesta..."):
                 resultado = procesar_texto(entrada_texto)
+            espacio_contenido_generado.write(f"**Respuesta:** {resultado}")
+            if st.button("🔊 Escuchar respuesta"):
                 hablar_texto(resultado)
     elif tipo_entrada == "🖼️ Subir imagen":
             st.image(imagen, caption='Imagen subida.', use_column_width=True)
             with st.spinner("Procesando imagen..."):
                 respuesta = procesar_imagen(entrada_imagen)
+            espacio_contenido_generado.write(f"**Respuesta de la imagen:** {respuesta}")
+st.write("¡Gracias por usar el ChatBot! 😊")