Spaces:

jeysshon
/

Soph-IA

Sleeping

App Files Files Community

jeysshon commited on Sep 7, 2024

Commit

e50eaad

verified ·

1 Parent(s): c9a4feb

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -2

app.py CHANGED Viewed

@@ -1,5 +1,6 @@
 import streamlit as st
 from PIL import Image
 import google.generativeai as genai
 from gtts import gTTS
 import os
@@ -22,12 +23,27 @@ def procesar_imagen(imagen):
     respuesta = modelo.generate_content(imagen.name)
     return respuesta.text
 def hablar_texto(texto):
     try:
         tts = gTTS(text=texto, lang='es')
         archivo_audio = "respuesta.mp3"
         tts.save(archivo_audio)
-        os.system(f"mpg321 {archivo_audio}")  # Usa otro reproductor si es necesario
     except Exception as e:
         st.error(f"Error al generar audio: {e}")
@@ -65,4 +81,12 @@ with col2:
             espacio_contenido_generado.write(respuesta)
     elif tipo_entrada == "🎤 Usar micrófono":
-        st.write("Esta funcionalidad ha sido deshabilitada en esta versión.")

 import streamlit as st
 from PIL import Image
+import speech_recognition as sr
 import google.generativeai as genai
 from gtts import gTTS
 import os
     respuesta = modelo.generate_content(imagen.name)
     return respuesta.text
+def reconocer_voz():
+    try:
+        reconocedor = sr.Recognizer()
+        with sr.Microphone() as fuente:
+            st.write("Escuchando...")
+            audio = reconocedor.listen(fuente)
+        texto = reconocedor.recognize_google(audio)
+        return texto
+    except sr.UnknownValueError:
+        return "El reconocimiento de voz de Google no pudo entender el audio"
+    except sr.RequestError as e:
+        return f"No se pudieron solicitar resultados del servicio de reconocimiento de voz de Google; {e}"
+    except Exception as e:
+        return f"Error al reconocer la voz: {e}"
 def hablar_texto(texto):
     try:
         tts = gTTS(text=texto, lang='es')
         archivo_audio = "respuesta.mp3"
         tts.save(archivo_audio)
+        os.system(f"mpg321 {archivo_audio}")  # Puedes usar otro reproductor como afplay en macOS o VLC
     except Exception as e:
         st.error(f"Error al generar audio: {e}")
             espacio_contenido_generado.write(respuesta)
     elif tipo_entrada == "🎤 Usar micrófono":
+        if st.button("Grabar"):
+            texto_de_voz = reconocer_voz()
+            st.text_input("Texto reconocido", value=texto_de_voz)  # Muestra el texto reconocido
+            if texto_de_voz:
+                with st.spinner("Generando respuesta..."):
+                    resultado = procesar_texto(texto_de_voz)
+                espacio_contenido_generado.write(resultado)
+                if st.button("🔊 Hablar", key="hablar_entrada_voz"):
+                    hablar_texto(resultado)