Spaces:

Kvikontent
/

img2music

Runtime error

App Files Files Community

Kvikontent commited on Dec 25, 2023

Commit

5074feb

1 Parent(s): 1203e14

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -25

app.py CHANGED Viewed

@@ -5,18 +5,9 @@ import soundfile as sf
 from PIL import Image
 from io import BytesIO
-# Process the color information to create audio frequencies with extended parameters
-def process_color_to_audio(array, sample_rate=44100, duration=5, **kwargs):
-    amplitude_modulation = kwargs.get('amplitude_modulation', 1.0)
-    frequency_modulation = kwargs.get('frequency_modulation', 0.0)
-    harmonic_content = kwargs.get('harmonic_content', 1.0)
-    attack_time = kwargs.get('attack_time', 0.005)
-    decay_time = kwargs.get('decay_time', 0.1)
-    sustain_level = kwargs.get('sustain_level', 0.7)
-    release_time = kwargs.get('release_time', 0.3)
-    vibrato_freq = kwargs.get('vibrato_freq', 5.0)
-    vibrato_depth = kwargs.get('vibrato_depth', 0.005)
     normalized_colors = array / 255.0
     brightness = np.mean(normalized_colors, axis=(0, 1))
     brightness = brightness ** harmonic_content
@@ -43,20 +34,15 @@ def main():
         image = Image.open(uploaded_file)
         st.image(image, caption='Uploaded PNG image', use_column_width=True)
-        with st.expander("Audio Generation Parameters", expanded=True):
-            amplitude_modulation = st.slider("Amplitude Modulation", 0.0, 2.0, 1.0, 0.1)
-            frequency_modulation = st.slider("Frequency Modulation", -1.0, 1.0, 0.0, 0.1)
-            harmonic_content = st.slider("Harmonic Content", 0.1, 2.0, 1.0, 0.1)
-            attack_time = st.slider("Attack Time", 0.001, 0.1, 0.005, 0.001)
-            decay_time = st.slider("Decay Time", 0.01, 0.5, 0.1, 0.01)
-            sustain_level = st.slider("Sustain Level", 0.1, 1.0, 0.7, 0.1)
-            release_time = st.slider("Release Time", 0.1, 1.0, 0.3, 0.1)
-            vibrato_freq = st.slider("Vibrato Frequency", 0.1, 10.0, 5.0, 0.1)
-            vibrato_depth = st.slider("Vibrato Depth", 0.001, 0.01, 0.005, 0.001)
         if st.button("Generate Audio"):
             array = np.array(image)
-            audio_data, sample_rate = process_color_to_audio(array, amplitude_modulation=amplitude_modulation, frequency_modulation=frequency_modulation,
-                                                             harmonic_content=harmonic_content, attack_time=attack_time,
-                                                             decay_time=decay_time, sustain_level=sustain_level,
-                                                             relea

 from PIL import Image
 from io import BytesIO
+# Process the color information to create audio frequencies with extended parameters
+def process_color_to_audio(array, sample_rate=44100, duration=5, amplitude_modulation=1.0, frequency_modulation=0.0, harmonic_content=1.0, attack_time=0.005, decay_time=0.1, sustain_level=0.7, release_time=0.3, vibrato_freq=5.0, vibrato_depth=0.005):
     normalized_colors = array / 255.0
     brightness = np.mean(normalized_colors, axis=(0, 1))
     brightness = brightness ** harmonic_content
         image = Image.open(uploaded_file)
         st.image(image, caption='Uploaded PNG image', use_column_width=True)
+        st.write("Audio will be generated with default parameters.")
         if st.button("Generate Audio"):
             array = np.array(image)
+            audio_data, sample_rate = process_color_to_audio(array)
+            with BytesIO() as output:
+                sf.write(output, audio_data, sample_rate, format='wav')
+                st.audio(output.getvalue(), format='audio/wav')
+if __name__ == '__main__':
+    main()