Spaces:

jeysshon
/

Soph-IA

Sleeping

App Files Files Community

jeysshon commited on Sep 7, 2024

Commit

e9dd2d3

verified ·

1 Parent(s): e50eaad

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -33

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 import streamlit as st
 from PIL import Image
-import speech_recognition as sr
 import google.generativeai as genai
 from gtts import gTTS
 import os
@@ -12,31 +11,32 @@ st.set_page_config(layout="wide")
 api_key = "AIzaSyDJZ3r6VRhRivR0pb96cBRg_VvGg_fXq5k"  # API key proporcionada
 def procesar_texto(texto):
-    genai.configure(api_key=api_key)
-    modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
-    respuesta = modelo.generate_content(texto)
-    return respuesta.text
 def procesar_imagen(imagen):
-    genai.configure(api_key=api_key)
-    modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
-    respuesta = modelo.generate_content(imagen.name)
-    return respuesta.text
-def reconocer_voz():
     try:
-        reconocedor = sr.Recognizer()
-        with sr.Microphone() as fuente:
-            st.write("Escuchando...")
-            audio = reconocedor.listen(fuente)
-        texto = reconocedor.recognize_google(audio)
-        return texto
-    except sr.UnknownValueError:
-        return "El reconocimiento de voz de Google no pudo entender el audio"
-    except sr.RequestError as e:
-        return f"No se pudieron solicitar resultados del servicio de reconocimiento de voz de Google; {e}"
     except Exception as e:
-        return f"Error al reconocer la voz: {e}"
 def hablar_texto(texto):
     try:
@@ -59,7 +59,7 @@ with open("./style.css") as f:
 col1, col2 = st.columns([1, 3])
 with col1:
-    tipo_entrada = st.selectbox("Selecciona el tipo de entrada", ["Haz una pregunta❓", "🖼️ Subir imagen", "🎤 Usar micrófono"])
 with col2:
     if tipo_entrada == "Haz una pregunta❓":
@@ -80,13 +80,3 @@ with col2:
                 respuesta = procesar_imagen(entrada_imagen)
             espacio_contenido_generado.write(respuesta)
-    elif tipo_entrada == "🎤 Usar micrófono":
-        if st.button("Grabar"):
-            texto_de_voz = reconocer_voz()
-            st.text_input("Texto reconocido", value=texto_de_voz)  # Muestra el texto reconocido
-            if texto_de_voz:
-                with st.spinner("Generando respuesta..."):
-                    resultado = procesar_texto(texto_de_voz)
-                espacio_contenido_generado.write(resultado)
-                if st.button("🔊 Hablar", key="hablar_entrada_voz"):
-                    hablar_texto(resultado)

 import streamlit as st
 from PIL import Image
 import google.generativeai as genai
 from gtts import gTTS
 import os
 api_key = "AIzaSyDJZ3r6VRhRivR0pb96cBRg_VvGg_fXq5k"  # API key proporcionada
 def procesar_texto(texto):
+    try:
+        genai.configure(api_key=api_key)
+        modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
+        respuesta = modelo.generate_content(texto)
+        # Verifica si la respuesta contiene la propiedad `text`
+        if hasattr(respuesta, 'text'):
+            return respuesta.text
+        else:
+            return "No se pudo generar una respuesta válida."
+    except Exception as e:
+        st.error(f"Error al procesar el texto: {e}")
+        return "No se pudo generar una respuesta."
 def procesar_imagen(imagen):
     try:
+        genai.configure(api_key=api_key)
+        modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
+        respuesta = modelo.generate_content(imagen.name)
+        # Verifica si la respuesta contiene la propiedad `text`
+        if hasattr(respuesta, 'text'):
+            return respuesta.text
+        else:
+            return "No se pudo procesar la imagen correctamente."
     except Exception as e:
+        st.error(f"Error al procesar la imagen: {e}")
+        return "No se pudo procesar la imagen."
 def hablar_texto(texto):
     try:
 col1, col2 = st.columns([1, 3])
 with col1:
+    tipo_entrada = st.selectbox("Selecciona el tipo de entrada", ["Haz una pregunta❓", "🖼️ Subir imagen"])
 with col2:
     if tipo_entrada == "Haz una pregunta❓":
                 respuesta = procesar_imagen(entrada_imagen)
             espacio_contenido_generado.write(respuesta)