Spaces:

Ribot
/

PodMagic

Running

App Files Files Community

PodMagic / app.py

Ribot

Update app.py

c77e282 verified 26 days ago

raw

history blame

2.87 kB

	import gradio as gr
	import requests
	import re
	import os
	import zipfile
	import tempfile
	from urllib.parse import urljoin

	def process_url(url):
	try:
	headers = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'}
	response = requests.get(url, headers=headers)
	response.raise_for_status()
	except Exception as e:
	return None, f"Erreur de connexion : {str(e)}"

	# Recherche approfondie dans les scripts
	mp3_links = []
	pattern = r'(?:contentUrl\|url)"\s:\s"([^"]+?\.mp3)(?:[^"]*)"' # Capture les URLs .mp3 dans les objets JS
	matches = re.findall(pattern, response.text)

	for match in matches:
	# Nettoyage de l'URL
	clean_url = match.split('";')[0] if '";' in match else match
	absolute_url = urljoin(response.url, clean_url)
	mp3_links.append(absolute_url)

	# Dédoublonnage tout en conservant l'ordre
	seen = set()
	mp3_links = [x for x in mp3_links if not (x in seen or seen.add(x))]

	if not mp3_links:
	return None, "Aucun lien MP3 détecté dans le code source"

	# Téléchargement des fichiers
	temp_dir = tempfile.mkdtemp()
	filenames = []

	for idx, mp3_url in enumerate(mp3_links, 1):
	try:
	filename = f"{idx:02d}_{os.path.basename(mp3_url).split('?')[0]}"
	filepath = os.path.join(temp_dir, filename)

	with requests.get(mp3_url, headers=headers, stream=True) as r:
	r.raise_for_status()
	with open(filepath, 'wb') as f:
	for chunk in r.iter_content(chunk_size=8192):
	if chunk:
	f.write(chunk)
	filenames.append(filepath)
	except Exception as e:
	print(f"Échec du téléchargement {mp3_url} : {str(e)}")
	continue

	if not filenames:
	return None, "Échec de tous les téléchargements"

	# Création du ZIP
	zip_path = os.path.join(temp_dir, 'episodes.zip')
	with zipfile.ZipFile(zip_path, 'w') as zipf:
	for file in filenames:
	zipf.write(file, arcname=os.path.basename(file))

	return zip_path, None

	def download_podcast(url):
	zip_path, error = process_url(url)
	if error:
	raise gr.Error(error)
	return zip_path

	iface = gr.Interface(
	fn=download_podcast,
	inputs=gr.Textbox(label="URL Radio France", placeholder="Collez l'URL ici..."),
	outputs=gr.File(label="Épisodes téléchargés"),
	examples=[[
	"https://www.radiofrance.fr/franceculture/podcasts/serie-le-secret-de-la-licorne-les-aventures-de-tintin"
	]],
	title="Extracteur MP3 Radio France",
	description="Téléchargez les épisodes MP3 des podcasts Radio France directement depuis l'URL de la série"
	)

	iface.launch()