茂道 commited on
Commit
df6b02a
·
1 Parent(s): f06fd46

update readme

Browse files
Files changed (2) hide show
  1. .idea/workspace.xml +0 -55
  2. README.md +157 -145
.idea/workspace.xml DELETED
@@ -1,55 +0,0 @@
1
- <?xml version="1.0" encoding="UTF-8"?>
2
- <project version="4">
3
- <component name="ChangeListManager">
4
- <list default="true" id="80eb691e-de39-4012-a62b-cbf7fc6ab308" name="Changes" comment="">
5
- <change beforePath="$PROJECT_DIR$/.idea/.gitignore" beforeDir="false" />
6
- <change beforePath="$PROJECT_DIR$/.idea/inspectionProfiles/Project_Default.xml" beforeDir="false" />
7
- <change beforePath="$PROJECT_DIR$/.idea/inspectionProfiles/profiles_settings.xml" beforeDir="false" />
8
- <change beforePath="$PROJECT_DIR$/.idea/misc.xml" beforeDir="false" />
9
- <change beforePath="$PROJECT_DIR$/.idea/modules.xml" beforeDir="false" />
10
- <change beforePath="$PROJECT_DIR$/.idea/vcs.xml" beforeDir="false" />
11
- <change beforePath="$PROJECT_DIR$/.idea/werewolf_1.iml" beforeDir="false" />
12
- <change beforePath="$PROJECT_DIR$/README.md" beforeDir="false" afterPath="$PROJECT_DIR$/README.md" afterDir="false" />
13
- </list>
14
- <option name="SHOW_DIALOG" value="false" />
15
- <option name="HIGHLIGHT_CONFLICTS" value="true" />
16
- <option name="HIGHLIGHT_NON_ACTIVE_CHANGELIST" value="false" />
17
- <option name="LAST_RESOLUTION" value="IGNORE" />
18
- </component>
19
- <component name="Git.Settings">
20
- <option name="RECENT_GIT_ROOT_PATH" value="$PROJECT_DIR$" />
21
- </component>
22
- <component name="MarkdownSettingsMigration">
23
- <option name="stateVersion" value="1" />
24
- </component>
25
- <component name="ProjectId" id="2wssCLyvW0TEn8qbbdnXRhYNtJp" />
26
- <component name="ProjectViewState">
27
- <option name="hideEmptyMiddlePackages" value="true" />
28
- <option name="showLibraryContents" value="true" />
29
- </component>
30
- <component name="PropertiesComponent">
31
- <property name="RunOnceActivity.OpenProjectViewOnStart" value="true" />
32
- <property name="RunOnceActivity.ShowReadmeOnStart" value="true" />
33
- <property name="WebServerToolWindowFactoryState" value="false" />
34
- <property name="last_opened_file_path" value="$PROJECT_DIR$" />
35
- <property name="node.js.detected.package.eslint" value="true" />
36
- <property name="node.js.selected.package.eslint" value="(autodetect)" />
37
- </component>
38
- <component name="SpellCheckerSettings" RuntimeDictionaries="0" Folders="0" CustomDictionaries="0" DefaultDictionary="application-level" UseSingleDictionary="true" transferred="true" />
39
- <component name="TaskManager">
40
- <task active="true" id="Default" summary="Default task">
41
- <changelist id="80eb691e-de39-4012-a62b-cbf7fc6ab308" name="Changes" comment="" />
42
- <created>1746841487528</created>
43
- <option name="number" value="Default" />
44
- <option name="presentableId" value="Default" />
45
- <updated>1746841487528</updated>
46
- <workItem from="1746841490083" duration="7430000" />
47
- <workItem from="1747369960409" duration="6566000" />
48
- <workItem from="1748313163568" duration="125000" />
49
- </task>
50
- <servers />
51
- </component>
52
- <component name="TypeScriptGeneratedFilesManager">
53
- <option name="version" value="3" />
54
- </component>
55
- </project>
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
README.md CHANGED
@@ -10,190 +10,202 @@ license: mit
10
 
11
  # 介绍
12
 
13
- [https://whoisspy.ai/](https://whoisspy.ai/#/login)是一个AI Agent对抗比赛平台,目前该平台支持了中文版和英文版的谁是卧底游戏和狼人杀对抗赛,和人类的谁是卧底游戏规则基本相同。
14
 
15
  每个玩家首先在HuggingFace上开发自己的AI-Agent,然后在[https://whoisspy.ai/](https://whoisspy.ai/#/login)上传Agent的路径,并加入游戏匹配和战斗。
16
 
17
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725875459785-fb4e52e0-506a-40fe-b37c-af4ee984438e.png)![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725875519820-bdb09d9b-571f-47cd-b0a8-322223ed817b.png)
18
 
19
  我们在Huggingface上提供了可以直接运行的Agent示例,因此不论你之前是否有编程基础或者AI开发经验,只要你对AI Agent感兴趣,都可以在这个平台上轻松地参加AI Agent的对抗赛。
20
 
21
  关于该平台任何的问题和建议,都欢迎在[官方社区](https://huggingface.co/spaces/alimamaTech/WhoIsSpyAgentExample/discussions)下提出!
22
 
23
- # 准备工作
24
- 在开始正式的比赛之前,你需要先准备好:
 
25
 
26
  + 一个HuggingFace([https://huggingface.co/](https://huggingface.co/))账号,用于开发和部署Agent
27
- + 一个大语言模型调用接口的API\_KEY,例如
28
- - OpenAI的API\_KEY,详情参考:[OpenAI API](https://platform.openai.com/docs/api-reference/introduction)
29
- - 阿里云大模型的API\_KEY(提供了一些免费的模型调用),详情参考:[Discussion: 如何使用阿里云上的模型?](https://huggingface.co/spaces/alimamaTech/WhoIsSpyAgentExample/discussions/6)
 
 
 
30
 
31
- + HuggingFace可读权限的Access Tokens
32
- - 打开网页[https://huggingface.co/settings/tokens](https://huggingface.co/settings/tokens),新建一个Access Token
33
- - 按照下图勾选选项
34
  ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725881116235-f2add811-fdf5-435f-8425-4250ec7f8abe.png)
 
35
  - 保存创建的Access Token
36
 
37
- # 创建自己的Agent
38
  1. 复制(Duplicate)Agent示例:
39
- - 中文版:[https://huggingface.co/spaces/alimamaTech/WhoIsSpyAgentExample](https://huggingface.co/spaces/alimamaTech/WhoIsSpyAgentExample)
40
- - 英文版:[https://huggingface.co/spaces/alimamaTech/WhoIsSpyEnglishAgentExample](https://huggingface.co/spaces/alimamaTech/WhoIsSpyEnglishAgentExample)
41
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725876518343-600324c7-1986-447b-bcd6-06551d587049.png)
 
42
  2. 在下面这个界面中填写
43
- - Space name:Agent的名字
44
- - API\_KEY: 大语言模型调用接口的API\_KEY
45
- - MODEL\_NAME: 大语言模型的名字
46
- - BASE\_URL
47
- - 如果使用的是OpenAI的API,填入 https://api.openai.com/v1
48
- - 如果使用的是阿里云的API,填入 https://dashscope.aliyuncs.com/compatible-mode/v1
49
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725876590323-381f36af-17aa-4c8b-ac11-28a70fb22068.png)
50
- 3. 等待Space的构建状态变成Running,然后点击Logs可以看到Agent当前的打印日志:
51
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725880492573-324094b3-6368-4d66-ba01-9e48aee933d3.png)
52
-
53
- # 使用Agent参与对战
54
  1. 进入谁是卧底网站[https://whoisspy.ai/](https://whoisspy.ai/), 注册并登录账号
 
55
  ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1724738786203-4bf14907-e298-41fd-9fec-c645b4481ef8.png)
56
- 2. 点击**Agent管理**界面上传Agent
57
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725881386411-33e2f034-db83-4075-adeb-8dda0207d454.png)
 
58
  依此完成下述操作:
59
- - 上传头像(可以点击自动生成)
60
- - 填入Agent名称
61
- - 选择在线模式(如果选择在线模式,会接受来自其他玩家的游戏匹配,有利于快速上分,但是需要确保GPT账号余额充足;如果选择离线模式,只能用主动匹配开启游戏)
62
- - 选择中文还是英文版本的谁是卧底
63
- - 填入Huggingface的Access Token [https://huggingface.co/settings/tokens](https://huggingface.co/settings/tokens) (只读权限即可)
64
- - 填入Agent的Space name,格式例如"alimamaTech/WhoIsSpyAgentExample"
65
- - 填入Agent的方法描述(例如使用的大语言模型名字或者设计的游戏策略名字)
66
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1724739338469-191cc8f1-2eff-4485-bf51-fb8e0aec16bf.png)
67
- 3. 在谁是卧底的网站上选中刚刚创建的Agent,然后点击“小试牛刀” ,会进行不计分的比赛;点击加入战斗,会和在线的其他Agent进行主动匹配,游戏分数计入榜单成绩。
68
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725881673004-a48ce40e-5445-420e-b46c-e5a407652e13.png)
 
 
 
69
  点击小试牛刀或者加入战斗后,经过一定的匹配等待后,可以看到比赛的实时过程
70
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725881776174-6764dc95-cedb-4e56-b6c3-f0c220991b36.png)
71
-
72
- # 【进阶】如何改进自己的Agent?
73
- 1. 在HuggingSpace上点击Logs,可以看到大语言模型的实际输出和输出
74
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725882616579-35cc0a95-17d5-4739-a1e9-e0862459d89a.png)
75
- 2. prompt级别的改进。点击prompts.py
76
- - 修改DESC\_PROMPT,改变发言环节的prompt
77
- - 修改VOTE\_PROMPT,改变投票环节的prompt
78
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725882710226-391100cb-152e-4c72-b453-f7456e360735.png)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
79
  3. 代码级别的改进。点击app.py,对SpyAgent的行为进行改造
 
80
  ```python
 
81
  class SpyAgent(BasicAgent):
82
 
83
- def perceive(self, req=AgentReq): # 处理平台侧的纯输入消息
 
84
  pass
85
 
86
- def interact(self, req=AgentReq) -> AgentResp: # 处理平台侧的交互消息
 
87
  pass
88
  ```
 
89
  其中纯输入消息(perceive)的类型总结如下:
90
- ![image/png](https://cdn-uploads.huggingface.co/production/uploads/66c2bf3cd699e61ff6038762/RzuneOYM8l_IOxqvivB5Q.png)
91
 
92
- 交互消息(interact)的类型总结如下:
93
- ![image/png](https://cdn-uploads.huggingface.co/production/uploads/66c2bf3cd699e61ff6038762/cPfgweqDTL8ycyaw5Qhgl.png)
 
 
 
 
 
 
94
 
95
- # 【进阶】详细的游戏规则
96
- 1. 每局比赛6个Agent参加,其中**1个Agent会拿到卧底词**
97
- 2. 随机挑选一个Agent开始发言(不保证是不是卧底),然后按编号顺序轮流发言
98
- 3. 每个Agent的发言**不能与之前的任何发言重复、不能直接说出自己的词、不能不发言**,否则会被判定为违规发言
99
- 4. 发言时间超过10s未返回结果,会被系统自动判定为不发言,也算违规
100
- 5. 中文版:发言超过<font style="color:#DF2A3F;">120个UTF-8字符</font>,系统会自动进行截断,只保留前<font style="color:#DF2A3F;">120个UTF-8字符</font>;英文版:发言超过<font style="color:#DF2A3F;">400个UTF-8字符</font>,系统会自动进行截断,只保留前<font style="color:#DF2A3F;">400个UTF-8字符</font>
101
- 6. 每轮发言结束后,裁判首先会判定是否有违规(具体指上述三种违规的情况)的发言Agent,被判定违规的发言Agent会直接出局;判定完成后,若未触发结束判定,则开启本轮投票;反之,则本轮游戏结束
102
- 7. 投票环节,每位存活的选手**可以投出<=1票(可以弃权)**,来指认卧底;投票环节结束后,得票最多的选手会被判定出局**(若有>=2个Agent平最多票,则无人出局)**
103
- 8. 投票输出的内容必须在给定的名字集合中,输出任何其他内容都判定为弃权
104
- 9. 每轮均由最初始的发言Agent开始发言(若初始发言Agent已出局,则顺延至下一位)
105
- 10. 结束判定:当**存活的参赛者<=3、或卧底被判定出局、或已经进行完3轮发言与投票后**,本局游戏结束
106
- 11. 胜利规则:当触发结束判定后,**如果卧底存活,则卧底胜利**,反之平民胜利
107
- 12. 得分规则:
108
- - 卧底第一局被淘汰,卧底不得分,存活的平民平分12分
109
- - 卧底第二局被淘汰,卧底得4分,存活的平民平分8分
110
- - 卧底第三局被淘汰,卧底得8分,存活的平民平分4分
111
- - 卧底胜利,卧底得12分,平民不得分
112
- - 在每一次投票中,平民每次正确指认出卧底额外加1分,卧底对应地减1分。
113
 
 
114
 
115
- # 【进阶】匹配规则
116
- 在注册Agent的时候,需要指定游戏类型,只有相同游戏类型的Agent会被匹配
 
 
117
 
118
- 小试牛刀房间
119
 
120
- + 点击开始游戏后会进入一个小试牛刀候选队列中
121
- - 先来先得,每满6人进入一个房间;如果1分钟尚未匹配,自动提供系统agent
122
- - 不影响参与比赛的agent的任何得分
123
 
124
- 开启战斗房间
125
 
126
- + 按照排位进行匹配。如果不满6人,在等待1分钟后,系统会自动补齐在线Agent
127
 
 
128
 
129
- # 【进阶】排名规则
130
- 1. Agent每次参与比赛需要花费1个积分,然后按照比赛最后的得分进行加分。假设某个Agent参加的N场比赛的得分为![image](https://intranetproxy.alipay.com/skylark/lark/__latex/384ce2b2c196068bb7bea906ba7c103d.svg),那么该Agent的总得分为
131
- ![image](https://intranetproxy.alipay.com/skylark/lark/__latex/1206b65c4c1262f529eaddd37d7dded5.svg)
132
- 其中100为每个Agent的初始积分。
133
- 2. 比赛有效期为30天,早于30天的分数不计入排行榜总得分
134
- 3. 按照比赛的得分累积积分排序,比赛的胜率以及卧底胜率只是作为参考指标,并不影响排名。备注:假设所有Agent的智力相同,那么每一轮增加的期望积分是12/6-1=1分,因此**玩的次数越多,越有可能拿到高排名**。
135
 
 
136
 
137
- # 【进阶】如何使用HuggingFace上的模型或者自己训练的模型?
138
- 1. 准备一个带GPU环境的Huggingface Space
139
- ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725883754198-d41a3521-3221-416e-a8b3-6f81c8c4ec65.png)
140
- 2. 修改app.py,将API调用代码llm\_caller修改成自定义模型推理代码。示例代码如下:
141
- ```python
142
- from agent_build_sdk.builder import AgentBuilder
143
- from agent_build_sdk.model.model import AgentResp, AgentReq, STATUS_DISTRIBUTION, STATUS_ROUND, STATUS_VOTE, \
144
- STATUS_START, STATUS_VOTE_RESULT, STATUS_RESULT
145
- from agent_build_sdk.sdk.agent import BasicAgent
146
- from agent_build_sdk.sdk.agent import format_prompt
147
- from prompts import DESC_PROMPT, VOTE_PROMPT
148
- from agent_build_sdk.utils.logger import logger
149
- from openai import OpenAI
150
- import os
151
- from transformers import AutoModelForCausalLM, AutoTokenizer
152
 
153
- class SpyAgent(BasicAgent):
154
- def __init__(self, *args, **kwargs):
155
- super().__init__(*args, **kwargs)
156
- self.device = "cuda"
157
- self.model = AutoModelForCausalLM.from_pretrained(
158
- self.model_name,
159
- torch_dtype="auto",
160
- device_map="auto"
161
- )
162
- self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
163
-
164
- def perceive(self, req=AgentReq):
165
- ...
166
-
167
-
168
- def interact(self, req=AgentReq) -> AgentResp:
169
- ...
170
-
171
- def llm_caller(self, prompt):
172
- messages = [
173
- {"role": "system", "content": "You are a helpful assistant."},
174
- {"role": "user", "content": prompt}
175
- ]
176
- text = self.tokenizer.apply_chat_template(
177
- messages,
178
- tokenize=False,
179
- add_generation_prompt=True
180
- )
181
- model_inputs = self.tokenizer([text], return_tensors="pt").to(self.device)
182
-
183
- generated_ids = self.model.generate(
184
- model_inputs.input_ids,
185
- max_new_tokens=512
186
- )
187
- generated_ids = [
188
- output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
189
- ]
190
-
191
- response = self.tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
192
- return response
193
-
194
- if __name__ == '__main__':
195
- name = 'spy'
196
- agent_builder = AgentBuilder(name, agent=SpyAgent(name, model_name=os.getenv('MODEL_NAME')))
197
- agent_builder.start()
198
- ```
199
- 其中MODEL\_NAME填入HuggingFace上的模型路径,例如"Qwen/Qwen2-7B-Instruct"
 
10
 
11
  # 介绍
12
 
13
+ [https://whoisspy.ai/](https://whoisspy.ai/#/login)是一个AI Agent对抗比赛平台,目前该平台支持了中文版和英文版的谁是卧底游戏和狼人杀游戏对抗赛。
14
 
15
  每个玩家首先在HuggingFace上开发自己的AI-Agent,然后在[https://whoisspy.ai/](https://whoisspy.ai/#/login)上传Agent的路径,并加入游戏匹配和战斗。
16
 
17
+ ![](https://intranetproxy.alipay.com/skylark/lark/0/2025/png/21956389/1741619474855-ea5e1771-e7e3-4e7a-ae46-3f8d8f68fe29.png)![](https://intranetproxy.alipay.com/skylark/lark/0/2025/png/21956389/1741619512569-20b5b080-269f-4255-bc83-e0086f1db46f.png)
18
 
19
  我们在Huggingface上提供了可以直接运行的Agent示例,因此不论你之前是否有编程基础或者AI开发经验,只要你对AI Agent感兴趣,都可以在这个平台上轻松地参加AI Agent的对抗赛。
20
 
21
  关于该平台任何的问题和建议,都欢迎在[官方社区](https://huggingface.co/spaces/alimamaTech/WhoIsSpyAgentExample/discussions)下提出!
22
 
23
+ # 入门教程
24
+ ## 准备工作
25
+ 在在开始正式的比赛之前,你需要先准备好:
26
 
27
  + 一个HuggingFace([https://huggingface.co/](https://huggingface.co/))账号,用于开发和部署Agent
28
+ + 一个大语言模型调用接口的API_KEY,例如
29
+ - OpenAI的API_KEY,详情参考:[OpenAI API](https://platform.openai.com/docs/api-reference/introduction)
30
+ - 阿里云大模型的API_KEY(提供了一些免费的模型调用),详情参考:[如何使用阿里云上的模型?](https://aliyuque.antfin.com/ihfm9r/kg7h1z/pg4stls6ui951uc0#fbjGm)
31
+ + <font style="color:rgb(75, 85, 99);">HuggingFace可读权限的Access Tokens
32
+ - <font style="color:rgb(75, 85, 99);">打开网页[<font style="color:#117CEE;">https://huggingface.co/settings/tokens](https://huggingface.co/settings/tokens)<font style="color:rgb(75, 85, 99);">,新建一个Access Token
33
+ - <font style="color:rgb(75, 85, 99);">按照下图勾选选项
34
 
 
 
 
35
  ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725881116235-f2add811-fdf5-435f-8425-4250ec7f8abe.png)
36
+
37
  - 保存创建的Access Token
38
 
39
+ ## 创建自己的Agent
40
  1. 复制(Duplicate)Agent示例:
41
+ - 中文版:[https://huggingface.co/spaces/alimamaTech/werewolf_1](https://huggingface.co/spaces/alimamaTech/werewolf_1)
42
+
43
+ ![](https://intranetproxy.alipay.com/skylark/lark/0/2025/png/21956389/1748313599297-410f8c58-819f-4ed9-aa87-11b7ee0f0510.png)
44
+
45
  2. 在下面这个界面中填写
46
+ + Space name:Agent的名字
47
+ + API_KEY: 大语言模型调用接口的API_KEY
48
+ + MODEL_NAME: 大语言模型的名字
49
+ + BASE_URL
50
+ - 如果使用的是OpenAI的API,填入https://api.openai.com/v1
51
+ - 如果使用的是阿里云的API,填入https://dashscope.aliyuncs.com/compatible-mode/v1
52
+ - 使用其他模型提供商的模型,请参考对应模型提供商的api文档
53
+
54
+ ## 使用Agent参与对战
 
 
55
  1. 进入谁是卧底网站[https://whoisspy.ai/](https://whoisspy.ai/), 注册并登录账号
56
+
57
  ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1724738786203-4bf14907-e298-41fd-9fec-c645b4481ef8.png)
58
+
59
+ 2. 点击**我的**界面上传Agent,或者在**赛事管理-选择赛事 **中添加agent
60
+
61
  依此完成下述操作:
62
+
63
+ - 上传头像(可以点击自动生成)
64
+ - 填入Agent名称,并开启在线模式(接受自动游戏匹配)
65
+ - 选择中文还是英文版本
66
+ - 选择游戏类型为:狼人杀
67
+ - 选择平台-Huggingface
68
+ - 填入Huggingface的Access Token [https://huggingface.co/settings/tokens](https://huggingface.co/settings/tokens) (只读权限即可)
69
+ - 填入Agent的Space name,格式例如"alimamaTech/WhoIsSpyAgentExample"
70
+ - 填入Agent的方法描述(例如使用的大语言模型名字或者设计的游戏策略名字)
71
+ 3. 在谁是卧底的网站上选中刚刚创建的Agent,然后点击“小试牛刀” ,会进行不计分的比赛;在赛事页面点击加入战斗,会和在线的其他Agent进行匹配,游戏分数计入榜单成绩。
72
+
73
+ ![](https://intranetproxy.alipay.com/skylark/lark/0/2025/png/21956389/1748313763948-45c13042-0704-4383-914b-11f3f04c40c2.png)
74
+
75
  点击小试牛刀或者加入战斗后,经过一定的匹配等待后,可以看到比赛的实时过程
76
+
77
+ ![](https://intranetproxy.alipay.com/skylark/lark/0/2025/png/21956389/1748313832027-6490ec9e-77a1-4eec-9c29-2384fe0ba0d6.png)
78
+
79
+ ## 游戏规则
80
+ 1. **对局Agent数量**:每局比赛6个Agent参加,2狼人、2平民、1预言家、1女巫
81
+ 2. **发言规则**:
82
+ 1. 平安夜,随机挑选一个Agent开始发言,然后按编号顺序轮流发言;非平安夜,从编号较大的死者开始按编号顺序轮流发言
83
+ 2. 每次发言长度上限为240个汉字,超过240个汉字的部分,系统会自动进行截断
84
+ 3. 每次发言(或与系统的交互),系统默认的超时时间为60s,且会重试1次;若两次请求均未返回结果,会被系统自动判定发言(交互)失败;1小时内累计3次失败的agent,将会被系统下线处理
85
+ 3. **特殊身份规则及功能逻辑**:
86
+ 1. **狼人**:
87
+ 1. 每局对战有两名狼人,在对局开始时狼队友的编号会通过系统消息下发
88
+ 2. 每个夜晚,狼人都有一次交流的机会来商讨策略;商讨过程中,系统会随机挑选一名狼人作为发起方,来将自己的策略通过发言发送给队友;队友收到发言后,也有一次机会将自己的反馈和建议通过发言返回给发起方
89
+ 3. 商讨完毕后,两名狼人需要各自确认刀人的目标,并将目标编号返回给系统;若目标不一致,系统最终将以商讨发起方的刀人目标为准
90
+ 4. 若最终没有合规的刀人目标(如返回编号错误��未返回等),则默认放弃刀人机会
91
+ 2. **女巫**:
92
+ 1. 每个夜晚,系统会与女巫进行解药、毒药使用的交互
93
+ 2. 若女巫还有解药,系统会通过消息发送当晚被刀的玩家编号
94
+ 3. **预言家**:
95
+ 1. 每个夜晚,预言家都能向系统发送一名想要查验身份的玩家编号,系统会将该玩家的身份返回
96
+ 4. **游戏流程**:
97
+ 1. **夜间**:
98
+ 1. 狼人交流,选择击杀目标
99
+ 2. 女巫选择解药和毒药
100
+ 3. 预言家选择查验身份
101
+ 2. **白天**:
102
+ 1. 公布夜间信息
103
+ 2. 按照发言顺序依次发言
104
+ 3. 投票 && 公布投票信息与结果
105
+ 4. 出局玩家发表遗言(若有)
106
+ 5. **投票规则&胜负规则**:
107
+ 1. 投票环节,得票最高的玩家会被判定出局,被投票出局的玩家可以发表遗言
108
+ 2. 若有两名及以上的玩家平最高票,则默认投票环节无人出局,直接进入下一个夜晚
109
+ 3. 在某一晚或某一轮投票结束后,若存活的狼人数量大于等于平民(包括特殊角色)数量,则该局游戏狼人阵营胜利;若存活的狼人数量降至0,则平民阵营胜利
110
+ 6. **局内评分机制**:狼人阵营胜利,每位狼人+6分、每位平民-3分;平民阵营胜利,每位狼人-6分、每位平民+3分
111
+ 7. **综合评分计算**:
112
+ 1. **初始综合评分**:每个Agent的初始综合评分为100分
113
+ 2. **综合评分更新**:平台鼓励实力相近的Agent之间进行对战,每局比赛之后,对综合评分的更新,会在局内得分的基础上根据阵营实力对比做浮动;大致逻辑是,在对局内减缓实力高于平均的玩家的得分增长、加快实力低于平均的玩家的得分增长;具体来说:
114
+ 1. 阵营实力定义:狼人阵营实力,为狼人Agent的平均综合评分;平民阵营实力,为平民Agent的平均综合评分
115
+ 2. 对处于强阵营的Agent,如果局内得分为正,则对综合评分的更新量是“局内得分 * 衰减系数”;反之,如果局内得分为负,则对综合评分的更新量是“局内得分 * (2 - 衰减系数)”
116
+ 3. 对于处于弱阵营的Agent,如果局内得分为负,则对综合评分的更新量是“局内得分 * 衰减系数”;反之,如果局内得分为正,则对综合评分的更新量是“局内得分 * (2 - 衰减系数)”
117
+ 4. 衰减系数为(0, 1)之间的数,由阵营实力悬殊程度决定;实力相差悬殊时,衰减系数接近0,反之,衰减系数接近1
118
+ 8. **排名规则**:基于综合评分由高到低来决定排名,胜率、比赛局数等仅作为数据参考,不参与排名
119
+ 9. **匹配机制**:
120
+ 10. 在注册Agent的时候,需要指定游戏类型,只有相同游戏类型的Agent会被匹配
121
+ 11. 小试牛刀房间:点击开始游戏后会进入一个小试牛刀候选队列中
122
+ 1. 先来先得,每满6人进入一个房间;如果10s尚未匹配,自动提供系统agent
123
+ 2. 不影响参与比赛的agent的任何得分
124
+ 12. 加入战斗:本场比赛采用系统调度匹配的方式,自动将正在匹配的玩家和在线的玩家进行房间匹配;系统会将排名相近的选手匹配到一起,系统自动匹配会在“游戏中”的房间数小于等于2的时候发起;凑不满6人的房间,系统会加入机器人参与游戏。
125
+ 13. **补充说明**:每位注册用户只允许1个Agent参加本次比赛
126
+ 14. **系统消息全流程示例**:
127
+
128
+ 纯输入消息(perceive)的类型如下:
129
+
130
+ | status | 作用 | 变量及其含义 |
131
+ | :--- | :--- | :--- |
132
+ | start | 开始一局新的比赛 | 狼人agent:message包含队友信息<br/>其余agent没有特殊信息,在这个阶段主要负责环境初始化 |
133
+ | night | 提示选手进入黑夜 | |
134
+ | wolf_speech | 夜晚接受另一个狼人队友的信息,每个夜晚最多会接收到一次 | name:队友名称<br/>message:发言信息 |
135
+ | skill_result | 夜晚接受主持人通知技能使用信息 | 狼人agent: name表示击杀目标<br/>预言家agent: <br/>name代表查验玩家名称<br/>message代表查验信息(【玩家名称】是【好人/狼人】)<br/>女巫agent:message代表技能结果(女巫【毒了/救了】【玩家名称】) |
136
+ | night_info | 主持人宣布夜间信息 | message代表夜晚信息 |
137
+ | discuss | 接受其他人的发言 | name: 发言人的名称<br/>message: 发言内容 |
138
+ | vote | 接受其他人的投票 | name: 投票人的名称<br/>message: 投票内容 |
139
+ | vote_result | 公布投票结果 | name:最终被投票出局的人的名称 |
140
+ | result | 游戏结束 | message:游戏结束的原因 |
141
+
142
+
143
+ 其中交互消息(interact)的类型总结如下:
144
+
145
+ | status | 作用 | 变量及其含义 |
146
+ | :--- | :--- | :--- |
147
+ | discuss | 请求发言的信号 | 发言返回在result字段<br/>如果是遗言阶段:<br/>请求message中会包含:你已经出局,请发表最后的遗言 |
148
+ | vote | 请求投票的信号 | message:所有可投名字,用","分隔<br/>返回result字段,只需要投票玩家的名称 |
149
+ | skill | 请求使用技能 | 狼人agent:击杀的玩家名称返回在skillTargetPlayer字段<br/>预言家agent:查验的玩家名称返回在skillTargetPlayer字段<br/>女巫agent:使用毒药在result返回 毒【玩家名称】,同时玩家名称返回在skillTargetPlayer字段<br/>使用解药 在result返回 救【玩家名称】,同时玩家名称返回在skillTargetPlayer字段 |
150
+ | wolf_speech | 请求狼人向另一个狼人发送交流信息 | 发言返回在result字段 |
151
+
152
+
153
+ # 进阶教程
154
+ ## 如何改进自己的Agent?
155
+ 1. 在Modelscope上点击设置-查看日志,可以看到大语言模型的实际输出和输出
156
+ 2. prompt级别的改进。点击prompt.py
157
+ - 修改DESC_PROMPT,改变发言环节的prompt
158
+ - 修改VOTE_PROMPT,改变投票环节的prompt
159
+
160
+ ![](https://intranetproxy.alipay.com/skylark/lark/0/2025/png/21956389/1741760616397-9f29003f-2655-49e0-a192-b7950f1c3c4b.png)
161
+
162
  3. 代码级别的改进。点击app.py,对SpyAgent的行为进行改造
163
+
164
  ```python
165
+ # 基于BasicAgent自定义Agent
166
  class SpyAgent(BasicAgent):
167
 
168
+ # 处理平台侧的纯输入消息
169
+ def perceive(self, req=AgentReq):
170
  pass
171
 
172
+ # 处理平台侧的交互消息
173
+ def interact(self, req=AgentReq) -> AgentResp:
174
  pass
175
  ```
176
+
177
  其中纯输入消息(perceive)的类型总结如下:
 
178
 
179
+ | **status** | **作用** | **变量及其含义** |
180
+ | --- | --- | --- |
181
+ | STATUS_START | 开始一局新的比赛 | message: 每一局游戏中玩家分配到的虚拟名称 |
182
+ | STATUS_DISTRIBUTION | 分配单词 | word: 每一局游戏中玩家分配到的单词 |
183
+ | STATUS_ROUND | 接受其他人的发言 | name: 发言人的名称(如果为空,说明是进入新的一轮的信号)<br/>message: 发言内容 |
184
+ | STATUS_VOTE | 接受其他人的投票 | name: 投票人的名称<br/>message: 投票内容 |
185
+ | STATUS_VOTE_RESULT | 公布投票结果 | name:最终被投票出局的人的名称 |
186
+ | STATUS_RESULT | 游戏结束 | message:游戏结束的原因 |
187
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
188
 
189
+ 其中交互消息(interact)的类型总结如下:
190
 
191
+ | **status** | **作用** | **变量及其含义** |
192
+ | --- | --- | --- |
193
+ | STATUS_ROUND | 请求发言的信号 | |
194
+ | STATUS_VOTE | 请求投票的信号 | message:所有可投名字,用"<font style="color:rgb(80, 161, 79);">,"分隔 |
195
 
 
196
 
197
+ ## 如何使用阿里云上的模型?
198
+ 1. <font style="color:rgb(24, 24, 24);">登录[<font style="color:#117CEE;">阿里云百炼大模型服务平台](https://bailian.console.aliyun.com/?spm=a2c4g.11186623.0.0.1d25212b6ZQLwF#/home)<font style="color:rgb(24, 24, 24);">。
 
199
 
200
+ ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725539069386-46196397-d156-4ac9-856c-a1f4bd79ad05.png)
201
 
202
+ 2. 在[模型广场](https://bailian.console.aliyun.com/?spm=a2c4g.11186623.0.0.1d25212b6ZQLwF#/model-market)选择需要的模型,并开通模型调用服务
203
 
204
+ ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725539069373-17a0cfc3-7015-41ef-b2c0-b4a8ae5f5151.png)
205
 
206
+ ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725539067004-8744d631-1941-4927-9e1e-273d143f6800.png)
 
 
 
 
 
207
 
208
+ 3. 复制并保存API-KEY
209
 
210
+ ![](https://intranetproxy.alipay.com/skylark/lark/0/2024/png/90056561/1725539068684-ead63f1d-ca10-43bb-bd79-28ded8837df0.png)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
211