Spaces:

jeysshon
/

Soph-IA

Sleeping

App Files Files Community

jeysshon commited on Sep 7, 2024

Commit

c0347bb

verified ·

1 Parent(s): c884a0c

Update app.py

Browse files

Files changed (1) hide show

app.py +52 -30

app.py CHANGED Viewed

@@ -3,22 +3,26 @@ from PIL import Image
 import speech_recognition as sr
 import google.generativeai as genai
 from gtts import gTTS
-import os
 # Configuración de la página de Streamlit
 st.set_page_config(layout="wide")
 # Configuración de la API key para Google Generative AI
-api_key = "AIzaSyDJZ3r6VRhRivR0pb96cBRg_VvGg_fXq5k" # Reemplaza con tu API Key
-# Función para procesar texto con Google Generative AI
 def procesar_texto(texto):
     genai.configure(api_key=api_key)
     modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
     respuesta = modelo.generate_content(texto)
     return respuesta.text
-# Función para reconocer voz desde un archivo de audio
 def reconocer_voz_desde_archivo(archivo_audio):
     reconocedor = sr.Recognizer()
     with sr.AudioFile(archivo_audio) as fuente:
@@ -31,37 +35,55 @@ def reconocer_voz_desde_archivo(archivo_audio):
     except sr.RequestError as e:
         return f"No se pudieron solicitar resultados del servicio de reconocimiento de voz de Google; {e}"
-# Función para convertir texto a voz
 def hablar_texto(texto):
-    tts = gTTS(texto, lang='es')
-    archivo_audio = "respuesta.mp3"
-    tts.save(archivo_audio)
-    st.audio(archivo_audio)
-    os.remove(archivo_audio)  # Elimina el archivo después de reproducirlo
-# Contenido principal de la aplicación
 st.title("🤖 ChatBot")
-tipo_entrada = st.selectbox("Selecciona el tipo de entrada", ["Haz una pregunta❓", "🖼️ Subir imagen", "🎤 Subir archivo de audio"])
-if tipo_entrada == "Haz una pregunta❓":
-    entrada_texto = st.text_input("Ingresa tu pregunta aquí")
-    if entrada_texto:
-        with st.spinner("Generando respuesta..."):
-            resultado = procesar_texto(entrada_texto)
-        st.write(resultado)
-        if st.button("🔊 Hablar", key="hablar_entrada_texto"):
-            hablar_texto(resultado)
-elif tipo_entrada == "🖼️ Subir imagen":
-    entrada_imagen = st.file_uploader("Sube una imagen", type=["jpg", "png", "jpeg"])
-    if entrada_imagen:
-        imagen = Image.open(entrada_imagen)
-        st.image(imagen, caption='Imagen subida.', use_column_width=True)
-elif tipo_entrada == "🎤 Subir archivo de audio":
-    archivo_audio = st.file_uploader("Sube un archivo de audio", type=["wav", "mp3"])
-    if archivo_audio:
-        with st.spinner("Procesando audio..."):
-            texto_de_voz = reconocer_voz_desde_archivo(archivo_audio)
             st.text_input("Texto reconocido", value=texto_de_voz)

 import speech_recognition as sr
 import google.generativeai as genai
 from gtts import gTTS
+import io
 # Configuración de la página de Streamlit
 st.set_page_config(layout="wide")
 # Configuración de la API key para Google Generative AI
+api_key = "AIzaSyDJZ3r6VRhRivR0pb96cBRg_VvGg_fXq5k"  # API key proporcionada
 def procesar_texto(texto):
     genai.configure(api_key=api_key)
     modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
     respuesta = modelo.generate_content(texto)
     return respuesta.text
+def procesar_imagen(imagen):
+    genai.configure(api_key=api_key)
+    modelo = genai.GenerativeModel('gemini-1.5-pro-latest')
+    respuesta = modelo.generate_content(imagen.name)  # Puedes ajustar esto si la API espera contenido de imagen real
+    return respuesta.text
 def reconocer_voz_desde_archivo(archivo_audio):
     reconocedor = sr.Recognizer()
     with sr.AudioFile(archivo_audio) as fuente:
     except sr.RequestError as e:
         return f"No se pudieron solicitar resultados del servicio de reconocimiento de voz de Google; {e}"
 def hablar_texto(texto):
+    tts = gTTS(text=texto, lang='es')
+    archivo_audio = io.BytesIO()
+    tts.write_to_fp(archivo_audio)
+    archivo_audio.seek(0)
+    st.audio(archivo_audio, format="audio/mp3")
 st.title("🤖 ChatBot")
+espacio_contenido_generado = st.empty()
+# Cargar y aplicar CSS personalizado
+with open("./style.css") as f:
+    st.markdown(f"<style>{f.read()}</style>", unsafe_allow_html=True)
+# Contenido principal
+col1, col2 = st.columns([1, 3])
+with col1:
+    tipo_entrada = st.selectbox("Selecciona el tipo de entrada", ["Haz una pregunta❓", "🖼️ Subir imagen", "🎤 Subir archivo de audio"])
+with col2:
+    if tipo_entrada == "Haz una pregunta❓":
+        entrada_texto = st.text_input("Ingresa tu pregunta aquí")
+        if entrada_texto:
+            with st.spinner("Generando respuesta..."):
+                resultado = procesar_texto(entrada_texto)
+            espacio_contenido_generado.write(resultado)
+            if st.button("🔊 Hablar", key="hablar_entrada_texto"):
+                hablar_texto(resultado)
+    elif tipo_entrada == "🖼️ Subir imagen":
+        entrada_imagen = st.file_uploader("Sube una imagen", type=["jpg", "png", "jpeg"])
+        if entrada_imagen:
+            imagen = Image.open(entrada_imagen)
+            st.image(imagen, caption='Imagen subida.', use_column_width=True)
+            with st.spinner("Procesando imagen..."):
+                respuesta = procesar_imagen(entrada_imagen)
+            espacio_contenido_generado.write(respuesta)
+    elif tipo_entrada == "🎤 Subir archivo de audio":
+        archivo_audio = st.file_uploader("Sube un archivo de audio", type=["wav", "mp3"])
+        if archivo_audio:
+            with st.spinner("Procesando audio..."):
+                texto_de_voz = reconocer_voz_desde_archivo(archivo_audio)
             st.text_input("Texto reconocido", value=texto_de_voz)
+            if texto_de_voz:
+                with st.spinner("Generando respuesta..."):
+                    resultado = procesar_texto(texto_de_voz)
+                espacio_contenido_generado.write(resultado)
+                if st.button("🔊 Hablar", key="hablar_entrada_audio"):
+                    hablar_texto(resultado)