work

Sleeping

App Files Files Community

sjdnjn commited on Jun 28

Commit

8616ccd

verified ·

1 Parent(s): 7b4a76c

Update app.py

Browse files

Files changed (1) hide show

app.py +66 -36

app.py CHANGED Viewed

@@ -1,12 +1,12 @@
 import gradio as gr
 import torch
-from transformers import pipeline, AutoTokenizer, AutoModelForSequenceClassification # 导入AutoTokenizer, AutoModelForSequenceClassification用于问答模型
 import pandas as pd
 import plotly.express as px
-import os # 用于检查文件是否存在
 # --- 1. 模型加载 ---
-# 负责同学: [填写负责这个模型的同学姓名]
 # 注意：QuantFactory/Apollo2-7B-GGUF 模型通常不直接兼容 pipeline("text-generation", ...)
 # 除非有额外的llama.cpp或特定的transformers加载配置。
 # 为了演示和确保运行流畅，这里使用 gpt2-large 作为替代。
@@ -18,7 +18,7 @@ except Exception as e:
     print(f"❌ 模型 1 (文本生成: {model1_name}) 加载失败: {e}")
     generator1 = None
-# 负责同学: [填写负责这个模型的同学姓名]
 # deepset/roberta-base-squad2 是一个问答模型，需要 context
 try:
     model2_name = "deepset/roberta-base-squad2"
@@ -144,37 +144,67 @@ def create_arena_tab():
     return arena_block
 # Report 选项卡内容创建函数 (30分)
 def create_report_tab():
-    report_md_path = "report.md" # 假设你的报告 Markdown 文件名为 report.md
-    if os.path.exists(report_md_path):
-        with open(report_md_path, "r", encoding="utf-8") as f:
-            report_content = f.read()
-        return gr.Markdown(report_content)
-    else:
-        return gr.Markdown(f"## ❗ 错误：未找到报告文件 '{report_md_path}'。\n请确保已在Files页面创建 `report.md` 文件。")
-# --- Gradio 应用界面定义 ---
-with gr.Blocks(title="AI模型对比项目") as demo:
-    gr.Markdown("# 🤖 AI 模型对比与评估平台")
-    gr.Markdown("本平台旨在通过交互式界面，对比分析不同 AI 模型在特定任务上的表现。")
-    # 定义选项卡
-    with gr.Tab("⚔️ Arena"):
-        # 直接调用创建函数，不再需要 .render()
-        create_arena_tab()
-    with gr.Tab("📊 LLM Benchmark"):
-        # 直接调用创建函数，不再需要 .render()
-        create_benchmark_tab()
-    with gr.Tab("📝 Report"):
-        # 直接调用创建函数，不再需要 .render()
-        create_report_tab()
-# 启动 Gradio 应用
-if __name__ == "__main__":
-    demo.launch()

 import gradio as gr
 import torch
+from transformers import pipeline, AutoTokenizer, AutoModelForSequenceClassification
 import pandas as pd
 import plotly.express as px
+import os
 # --- 1. 模型加载 ---
+# 负责同学: [填写负责这个模型的同学姓名，例如：张三]
 # 注意：QuantFactory/Apollo2-7B-GGUF 模型通常不直接兼容 pipeline("text-generation", ...)
 # 除非有额外的llama.cpp或特定的transformers加载配置。
 # 为了演示和确保运行流畅，这里使用 gpt2-large 作为替代。
     print(f"❌ 模型 1 (文本生成: {model1_name}) 加载失败: {e}")
     generator1 = None
+# 负责同学: [填写负责这个模型的同学姓名，例如：李四]
 # deepset/roberta-base-squad2 是一个问答模型，需要 context
 try:
     model2_name = "deepset/roberta-base-squad2"
     return arena_block
 # Report 选项卡内容创建函数 (30分)
+# 报告内容直接嵌入到代码中
 def create_report_tab():
+    report_content_markdown = """
+# 🚀 Hugging Face 模型对比实验报告
+## 1. 模型及类别选择
+### 1.1 所选模型的类型与背景说明
+本次实验聚焦于**文本处理模型**，具体包括一个**通用文本生成模型**和一个**抽取式问答模型**。
+* **文本生成模型**能够根据输入的提示词（prompt）生成连贯、有意义的文本，广泛应用于自动写作、内容创作等。
+* **抽取式问答模型**则专注于从给定文本（上下文）中精确地定位并提取问题的答案，是信息检索和智能客服的核心技术。
+近年来，随着Transformer架构的普及和大规模预训练技术的进步，这两类模型的性能都取得了显著提升。
+### 1.2 模型用途对比简述
+我们选择了以下 2 个模型进行对比：
+* **模型 1: GPT2-Large (文本生成模型)**
+    * **用途简述**: 作为一个大型的通用文本生成模型，GPT2-Large 能够进行开放式文本生成、续写、摘要、创意写作等多种任务。它能理解较复杂的指令并生成语法流畅、内容丰富的文本。
+* **模型 2: deepset/roberta-base-squad2 (抽取式问答模型)**
+    * **用途简述**: 这是一个专门用于抽取式问答任务的模型。它接收一个问题和一段上下文文本，然后从上下文中找到并返回问题的确切答案片段。主要应用于精准信息提取、文档问答系统等。
+### 1.3 选取标准与模型异同点分析
+**选取标准**: 我们选择这两个模型主要基于以下标准：
+1.  **代表性**: 它们分别代表了文本处理领域中两种核心且不同的应用方向（生成与抽取）。
+2.  **可用性**: 模型在 Hugging Face Model Hub 上易于加载和使用 `pipeline`。
+3.  **性能对比潜力**: 两种不同类型的模型在 GRACE 维度上会有显著差异，有利于进行有深度的对比分析。
+**异同点分析**:
+* **相同点**:
+    * 都基于 Transformer 架构。
+    * 都处理自然语言文本作为输入。
+    * 都可以在 Hugging Face `transformers` 库中通过 `pipeline` 方便地加载和使用。
+* **不同点**:
+    * **任务类型**: GPT2-Large 专注于**文本生成**（从无到有），而 RoBERTa-SQuAD2 专注于**信息抽取**（从已有文本中找）。
+    * **输入输出模式**:
+        * GPT2-Large 接收一个提示词，输出一段新的、连贯的文本。
+        * RoBERTa-SQuAD2 接收一个问题和一段上下文，输出上下文中精确的答案片段。
+    * **“创造性”**: GPT2-Large 具有更强的创造性，能够生成新的、未曾出现过的句子和想法；RoBERTa-SQuAD2 不具备创造性，它只从原文中抽取答案。
+    * **对上下文的依赖**: 问答模型对上下文的依赖性极强，没有上下文就无法回答；文本生成模型则更灵活，即便没有明确上下文也能生成内容。
+---
+## 2. 系统实现细节
+### 2.1 Gradio 交互界面截图
+以下是我们在 Hugging Face Space 中构建的 Gradio 交互界面截图。
+[Image of Gradio Arena 界面截图]
+*(请将此处的图片链接替换为你实际上传到 Space Files 中的截图链接，例如：`/file/main/arena_screenshot.png`)*
+*说明：此图展示了我们构建的“Arena”选项卡界面。用户可以在左侧输入问题/提示词和上下文，右侧同步显示文本生成模型和问答模型的输出。*
+### 2.2 输入与输出流程图
+```mermaid
+graph TD
+    A[用户输入: 问题/提示词] --> B{Gradio 界面};
+    A --> C[用户输入: 上下文];
+    C --> B;
+    B -- 将问题与上下文合并为Prompt --> D1[调用 GPT2-Large (文本生成模型)];
+    B -- 将问题与上下文分离 --> D2[调用 RoBERTa-SQuAD2 (问答模型)];
+    D1 -- 生成文本 --> E1[GPT2-Large 输出];
+    D2 -- 抽取答案 --> E2[RoBERTa-SQuAD2 输出];
+    E1 --> F[在 Gradio 界面显示];
+    E2 --> F;