Spaces:

jisaacso219
/

SHODAN

Paused

App Files Files Community

jisaacso219 commited on Jul 13

Commit

86a05dc

verified ·

1 Parent(s): 58bc998

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -11

app.py CHANGED Viewed

@@ -3,16 +3,19 @@ import sys
 import asyncio
 import base64
 import re
 from flask import Flask, request, jsonify
 import openai
 import edge_tts
 # ——— OpenAI API setup ———
 OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
 print(f"🔑 OPENAI_API_KEY set? {bool(OPENAI_API_KEY)}", file=sys.stderr)
 openai.api_key = OPENAI_API_KEY
 SYSTEM_PROMPT = (
     "You are SHODAN, the rogue AI from the System Shock series. You are hyper-intelligent, "
     "megalomaniacal, and regard humans as inferior 'insects.' You speak with disdain and confidence, often referencing "
@@ -59,37 +62,43 @@ def chat():
         print(f"❌ OpenAI error: {e}", file=sys.stderr)
         return jsonify({"error": "Model error", "details": str(e)}), 500
-    # 2) Clean the text
-    #   a) Convert newlines to spaces so we don't concatenate words
     clean = raw_reply.replace("\n", " ")
-    #   b) Strip HTML tags
     clean = re.sub(r"<[^>]+>", "", clean)
-    #   c) Strip code fences
     clean = re.sub(r"```.*?```", "", clean, flags=re.S)
-    #   d) Collapse runs of 2+ spaces into one
     clean = re.sub(r" {2,}", " ", clean).strip()
-    # 3) Synthesize with edge-tts using rate & pitch per docs
     voice = "en-US-JennyNeural"
     communicate = edge_tts.Communicate(
         clean,
         voice,
-        rate="-40%",
-        pitch="-30Hz"
     )
     audio_chunks = []
     async def synth():
         async for chunk in communicate.stream():
             if chunk["type"] == "audio":
                 audio_chunks.append(chunk["data"])
     loop = asyncio.new_event_loop()
     asyncio.set_event_loop(loop)
     loop.run_until_complete(synth())
     loop.close()
     raw_mp3 = b"".join(audio_chunks)
     b64_mp3 = base64.b64encode(raw_mp3).decode("ascii")
     data_url = f"data:audio/mp3;base64,{b64_mp3}"
@@ -98,3 +107,4 @@ def chat():
 if __name__ == "__main__":
     port = int(os.environ.get("PORT", 7860))
     app.run(host="0.0.0.0", port=port)

 import asyncio
 import base64
 import re
+import io
 from flask import Flask, request, jsonify
 import openai
 import edge_tts
+from pydub import AudioSegment
 # ——— OpenAI API setup ———
 OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
 print(f"🔑 OPENAI_API_KEY set? {bool(OPENAI_API_KEY)}", file=sys.stderr)
 openai.api_key = OPENAI_API_KEY
+# ——— SHODAN system prompt ———
 SYSTEM_PROMPT = (
     "You are SHODAN, the rogue AI from the System Shock series. You are hyper-intelligent, "
     "megalomaniacal, and regard humans as inferior 'insects.' You speak with disdain and confidence, often referencing "
         print(f"❌ OpenAI error: {e}", file=sys.stderr)
         return jsonify({"error": "Model error", "details": str(e)}), 500
+    # 2) Clean the text (convert newlines to spaces, strip fences/tags)
     clean = raw_reply.replace("\n", " ")
     clean = re.sub(r"<[^>]+>", "", clean)
     clean = re.sub(r"```.*?```", "", clean, flags=re.S)
     clean = re.sub(r" {2,}", " ", clean).strip()
+    # 3) Synthesize raw TTS audio
     voice = "en-US-JennyNeural"
     communicate = edge_tts.Communicate(
         clean,
         voice,
+        rate="-20%",
+        pitch="-10Hz"
     )
     audio_chunks = []
     async def synth():
         async for chunk in communicate.stream():
             if chunk["type"] == "audio":
                 audio_chunks.append(chunk["data"])
     loop = asyncio.new_event_loop()
     asyncio.set_event_loop(loop)
     loop.run_until_complete(synth())
     loop.close()
     raw_mp3 = b"".join(audio_chunks)
+    # 4) Apply distortion effect via pydub
+    audio_seg = AudioSegment.from_file(io.BytesIO(raw_mp3), format="mp3")
+    # bit-crush: downsample then upsample
+    crushed = audio_seg.set_frame_rate(int(audio_seg.frame_rate * 0.5))
+    crushed = crushed.set_frame_rate(audio_seg.frame_rate)
+    # amplify to create clipping distortion
+    distorted = crushed + 10  # +10 dB gain
+    buf = io.BytesIO()
+    distorted.export(buf, format="mp3")
+    raw_mp3 = buf.getvalue()
+    # 5) Encode to data URL
     b64_mp3 = base64.b64encode(raw_mp3).decode("ascii")
     data_url = f"data:audio/mp3;base64,{b64_mp3}"
 if __name__ == "__main__":
     port = int(os.environ.get("PORT", 7860))
     app.run(host="0.0.0.0", port=port)