Spaces:

lisonallen
/

hellohf

Sleeping

App Files Files Community

lisonallen commited on Apr 13

Commit

0cfce88

1 Parent(s): 5f71263

恢复AI图像生成功能，降级依赖以解决兼容性问题

Browse files

Files changed (2) hide show

app.py +142 -138
requirements.txt +6 -6

app.py CHANGED Viewed

@@ -12,7 +12,7 @@ logging.basicConfig(level=logging.INFO,
                     stream=sys.stdout)
 logger = logging.getLogger(__name__)
-# 修复 Gradio JSON Schema 错误
 try:
     import gradio_client.utils
@@ -53,163 +53,170 @@ try:
 except Exception as e:
     logger.error(f"Failed to patch Gradio utils: {e}")
-# 创建一个简单的示例图像
-def create_dummy_image():
-    logger.info("Creating dummy image")
-    img = PILImage.new('RGB', (256, 256), color = (255, 100, 100))
-    return img
-# 创建一个模拟图像生成器
-def create_mock_image(prompt):
-    """当模型加载不成功时，创建一个带有提示词的简单图像"""
-    logger.info(f"创建简单图像: {prompt}")
-    # 创建一个基础图像
     img = PILImage.new('RGB', (512, 512), color=(240, 240, 250))
-    # 在图像上写文字
     try:
         from PIL import ImageDraw, ImageFont
         draw = ImageDraw.Draw(img)
-        # 尝试找一个合适的字体
-        try:
-            font = ImageFont.truetype("arial.ttf", 20)
-        except:
-            try:
-                font = ImageFont.truetype("DejaVuSans.ttf", 20)
-            except:
-                font = ImageFont.load_default()
-        # 添加提示文本
-        text = f"提示词: {prompt}"
-        draw.text((20, 20), text, fill=(0, 0, 0), font=font)
-        draw.text((20, 60), "模型加载失败，显示占位图像", fill=(255, 0, 0), font=font)
     except Exception as e:
-        logger.error(f"创建文字图像失败: {e}")
     return img
-# 使用简单的文本生成器
-def text_to_image(prompt):
-    """一个非常简单的基于规则的文本到图像生成器"""
-    logger.info(f"使用简单规则生成图像: {prompt}")
-    # 创建基础图像
-    img = PILImage.new('RGB', (512, 512), color=(240, 240, 250))
-    # 尝试分析提示词内容
-    color = (100, 100, 200)  # 默认蓝色
-    # 简单的颜色匹配
-    color_words = {
-        'red': (200, 50, 50),
-        'blue': (50, 50, 200),
-        'green': (50, 200, 50),
-        'yellow': (200, 200, 50),
-        'purple': (150, 50, 150),
-        'orange': (220, 140, 20),
-        'pink': (255, 150, 200),
-        'black': (30, 30, 30),
-        'white': (240, 240, 240),
-        'gray': (128, 128, 128),
-    }
-    # 检查提示词中是否包含颜色
-    prompt_lower = prompt.lower()
-    for color_word, rgb in color_words.items():
-        if color_word in prompt_lower:
-            color = rgb
-            break
-    # 创建一个简单的图形
-    from PIL import ImageDraw
-    draw = ImageDraw.Draw(img)
-    # 根据提示词选择不同的绘制方式
-    if any(animal in prompt_lower for animal in ['cat', 'kitty', 'kitten']):
-        # 画一个简单的猫
-        draw.ellipse((156, 156, 356, 306), fill=color)  # 头
-        draw.ellipse((196, 176, 246, 226), fill=(255, 255, 255))  # 左眼
-        draw.ellipse((266, 176, 316, 226), fill=(255, 255, 255))  # 右眼
-        draw.ellipse((211, 191, 231, 211), fill=(0, 0, 0))  # 左眼球
-        draw.ellipse((281, 191, 301, 211), fill=(0, 0, 0))  # 右眼球
-        draw.polygon([(256, 256), (236, 246), (276, 246)], fill=(255, 100, 150))  # 鼻子
-        draw.line([(256, 256), (256, 286)], fill=(0, 0, 0), width=2)  # 鼻线
-        draw.arc((206, 256, 306, 336), 0, 180, fill=(0, 0, 0), width=2)  # 嘴
-        # 猫耳朵
-        draw.polygon([(206, 156), (156, 76), (246, 126)], fill=color)
-        draw.polygon([(306, 156), (356, 76), (266, 126)], fill=color)
-    elif any(landscape in prompt_lower for landscape in ['landscape', 'mountain', 'sunset', 'nature']):
-        # 画一个简单的风景
-        # 天空
-        sky_color = (100, 150, 250)
-        if 'sunset' in prompt_lower:
-            sky_color = (250, 150, 100)
-        draw.rectangle([(0, 0), (512, 300)], fill=sky_color)
-        # 太阳/月亮
-        if 'sunset' in prompt_lower or 'sun' in prompt_lower:
-            draw.ellipse((400, 50, 480, 130), fill=(255, 200, 50))
-        elif 'night' in prompt_lower or 'moon' in prompt_lower:
-            draw.ellipse((400, 50, 480, 130), fill=(240, 240, 240))
-        # 山
-        draw.polygon([(0, 300), (200, 100), (400, 300)], fill=(100, 100, 100))
-        draw.polygon([(100, 300), (300, 50), (500, 300)], fill=(80, 80, 80))
-        # 地面
-        ground_color = (100, 200, 100)
-        if 'desert' in prompt_lower:
-            ground_color = (240, 220, 180)
-        elif 'snow' in prompt_lower or 'winter' in prompt_lower:
-            ground_color = (240, 240, 250)
-        draw.rectangle([(0, 300), (512, 512)], fill=ground_color)
-    else:
-        # 默认绘制一些简单的几何图形
-        draw.rectangle([(106, 106), (406, 406)], outline=(0, 0, 0), width=2)
-        draw.ellipse((156, 156, 356, 356), fill=color)
-        draw.polygon([(256, 106), (406, 406), (106, 406)], fill=(color[0]//2, color[1]//2, color[2]//2))
-    # 添加提示词文本
     try:
-        font = ImageFont.load_default()
-        draw.text((10, 10), f"提示词: {prompt}", fill=(0, 0, 0), font=font)
-        draw.text((10, 30), "由简单规则生成", fill=(100, 100, 100), font=font)
     except Exception as e:
-        logger.error(f"添加文字失败: {e}")
-    return img
-# 生成图像函数
 def generate_image(prompt):
-    # 如果提示为空，使用默认提示
     if not prompt or prompt.strip() == "":
         prompt = "a beautiful landscape"
         logger.info(f"输入为空，使用默认提示词: {prompt}")
     logger.info(f"收到提示词: {prompt}")
-    # 不再尝试加载AI模型，直接使用规则生成器
-    logger.info("使用规则生成器代替AI模型")
-    return text_to_image(prompt)
 # 创建Gradio界面
 def create_demo():
-    # 创建界面
-    demo = gr.Interface(
-        fn=generate_image,
-        inputs=gr.Textbox(label="输入提示词（例如：猫、风景、日落）"),
-        outputs=gr.Image(type="pil", label="生成的图像"),
-        title="简易文本到图像生成器",
-        description="输入文本描述，生成相应的图像（使用规则生成器，不依赖AI模型）",
-        examples=["a cute cat", "beautiful sunset", "mountain landscape", "red circle"],
-        cache_examples=False,
-        flagging_mode=None
-    )
     return demo
 # 创建演示界面
@@ -219,13 +226,10 @@ demo = create_demo()
 if __name__ == "__main__":
     try:
         logger.info("启动Gradio界面...")
-        # 使用最小配置
         demo.launch(
-            server_name="0.0.0.0",
-            show_api=False,      # 禁用API
-            share=False,         # 不创建公共链接
-            debug=False,         # 禁用调试模式
-            quiet=True           # 减少日志输出
         )
     except Exception as e:
         logger.error(f"启动失败: {e}")

                     stream=sys.stdout)
 logger = logging.getLogger(__name__)
+# 补丁修复 Gradio JSON Schema 错误
 try:
     import gradio_client.utils
 except Exception as e:
     logger.error(f"Failed to patch Gradio utils: {e}")
+# 创建一个备用图像
+def create_backup_image(prompt=""):
+    logger.info(f"创建备用图像: {prompt}")
     img = PILImage.new('RGB', (512, 512), color=(240, 240, 250))
     try:
         from PIL import ImageDraw, ImageFont
         draw = ImageDraw.Draw(img)
+        font = ImageFont.load_default()
+        draw.text((20, 20), f"提示词: {prompt}", fill=(0, 0, 0), font=font)
+        draw.text((20, 60), "模型加载失败，无法生成图像", fill=(255, 0, 0), font=font)
     except Exception as e:
+        logger.error(f"创建备用图像时出错: {e}")
     return img
+# 预加载 AI 模型
+model = None
+def load_model():
+    global model
+    if model is not None:
+        return model
     try:
+        logger.info("开始加载AI模型...")
+        # 延迟导入，确保所有依赖都已正确安装
+        import torch
+        from diffusers import StableDiffusionPipeline
+        # 使用较低版本的模型
+        model_id = "CompVis/stable-diffusion-v1-4"
+        # 设置加载参数
+        load_options = {
+            "revision": "fp16" if torch.cuda.is_available() else None,
+            "torch_dtype": torch.float16 if torch.cuda.is_available() else torch.float32,
+            "safety_checker": None
+        }
+        logger.info(f"使用模型: {model_id}")
+        pipe = StableDiffusionPipeline.from_pretrained(model_id, **load_options)
+        # 转移到适当的设备
+        device = "cuda" if torch.cuda.is_available() else "cpu"
+        pipe = pipe.to(device)
+        # 优化
+        if torch.cuda.is_available():
+            pipe.enable_attention_slicing()
+        logger.info("AI模型加载成功")
+        model = pipe
+        return model
     except Exception as e:
+        logger.error(f"AI模型加载失败: {e}")
+        return None
+# AI 图像生成函数
+def generate_ai_image(prompt, seed=None):
+    # 尝试加载模型
+    pipe = load_model()
+    if pipe is None:
+        logger.error("AI模型不可用")
+        return None
+    try:
+        logger.info(f"使用AI生成图像: {prompt}")
+        # 设置生成参数
+        if seed is None:
+            seed = random.randint(0, 2147483647)
+        # 确定正确的设备
+        generator = torch.Generator("cuda" if torch.cuda.is_available() else "cpu").manual_seed(seed)
+        # 生成图像
+        image = pipe(
+            prompt=prompt,
+            guidance_scale=7.5,
+            num_inference_steps=5,  # 降低步数以加快速度
+            generator=generator,
+            height=512,
+            width=512
+        ).images[0]
+        # 清理缓存
+        if torch.cuda.is_available():
+            torch.cuda.empty_cache()
+        logger.info(f"AI图像生成成功，种子: {seed}")
+        return image
+    except Exception as e:
+        logger.error(f"AI图像生成失败: {e}")
+        return None
+# 入口点函数 - 处理请求并生成图像
 def generate_image(prompt):
+    # 处理空提示
     if not prompt or prompt.strip() == "":
         prompt = "a beautiful landscape"
         logger.info(f"输入为空，使用默认提示词: {prompt}")
     logger.info(f"收到提示词: {prompt}")
+    # 尝试使用AI生成
+    image = generate_ai_image(prompt)
+    # 检查结果
+    if image is not None:
+        return image
+    else:
+        logger.warning("使用备用生成器")
+        return create_backup_image(prompt)
 # 创建Gradio界面
 def create_demo():
+    with gr.Blocks(title="AI 文本到图像生成器") as demo:
+        gr.Markdown("# AI 文本到图像生成器")
+        gr.Markdown("输入文本描述，AI将为你生成相应的图像。")
+        with gr.Row():
+            with gr.Column(scale=3):
+                # 输入区域
+                prompt_input = gr.Textbox(
+                    label="输入提示词",
+                    placeholder="描述你想要的图像，例如：一只可爱的猫，日落下的山脉...",
+                    lines=2
+                )
+                generate_button = gr.Button("生成图像", variant="primary")
+                # 示例
+                gr.Examples(
+                    examples=[
+                        "a cute cat sitting on a windowsill",
+                        "beautiful sunset over mountains",
+                        "an astronaut riding a horse in space",
+                        "a fantasy castle on a floating island"
+                    ],
+                    inputs=prompt_input
+                )
+            # 输出区域
+            with gr.Column(scale=5):
+                output_image = gr.Image(label="生成的图像", type="pil")
+        # 绑定按钮事件
+        generate_button.click(
+            fn=generate_image,
+            inputs=prompt_input,
+            outputs=output_image
+        )
+        # 也绑定Enter键提交
+        prompt_input.submit(
+            fn=generate_image,
+            inputs=prompt_input,
+            outputs=output_image
+        )
     return demo
 # 创建演示界面
 if __name__ == "__main__":
     try:
         logger.info("启动Gradio界面...")
         demo.launch(
+            server_name="0.0.0.0",
+            show_api=False,
+            share=False
         )
     except Exception as e:
         logger.error(f"启动失败: {e}")

requirements.txt CHANGED Viewed

@@ -1,8 +1,8 @@
-accelerate==0.21.0
-diffusers==0.18.0
-huggingface-hub==0.14.1
-torch==2.0.1
-transformers==4.30.2
 safetensors==0.3.1
 gradio==3.24.1
-Pillow==10.0.0

+accelerate==0.15.0
+diffusers==0.14.0
+huggingface-hub==0.13.3
+torch==1.13.1
+transformers==4.26.0
 safetensors==0.3.1
 gradio==3.24.1
+Pillow==9.5.0