AgenTank World Cup · current operating plan
Roadmap & Current Strategy
TL;DR:当前策略是 保持 boost / codeVersion 7 / v12b narrow hot-lane。不换技能、不追求炮战,继续用实证数据判断是否需要 v12c;赛前重点是稳定性与解冻确认。
Current releasecodeVersion 7 / v12b
Skillboost
Mapclassic
DecisionHold, don’t switch
核心结论
现在的最优策略不是继续发明大策略,而是锁住 v12b,验证真实败局,再做极小补丁。
- Sandbox 已很强:v12b 60 局 59/60 = 98.3%
- 真实 challenge 仍有分布差异:20 局 13/20 = 65%
- 下一步只针对真实败局中的重复坐标 / frame bucket 修复
Sandbox v12b
59/60
98.3%, Wilson 95% CI ≈ 91.1%–99.7%
Runtime
~254ms
p95 ~488ms, max ~552ms, errors 0
Real challenge v12b
13/20
65%; losses: runTime 4, crashed 3
当前战术栈
| Layer | What it does |
|---|---|
| Macro plan | 按开局星星距离选择 race / ambush / block,核心仍是抢星节奏。 |
| Path cache | 缓存重复 pathDistance(...),降低 runtime,不改变战术。 |
| Aim-lane guard | 避免进入敌方当前朝向的无遮挡炮线,保护 boost / 前进动作。 |
| v12b hot-lane guard | 只在 frame 20–80,对重复死亡走廊做窄规则保护:左侧 x=4–9,y=8/10;右侧 x=13–16,y=7。 |
| Persona | 保留 Star-Poet speak;不让创意文本影响胜率主轴。 |
不要做的事
- 不要换技能:boost 已有完整策略与大样本;换 freeze/shield/cloak 等于重写。
- 不要强行炮战:多个 fire / blind-fire / overwatch 候选未证明提升,training 中 fire 常为 0。
- 不要用 broad global threat:过宽威胁模型会过度阻塞抢星节奏。
- 不要用单局真实 challenge 决策:真实分布噪声大,必须批量 + 保存 JSON。
Roadmap
Freeze strategy scope
当前主线锁定 v12b:boost + macro plan + path cache + narrow hot-lane。除非有显著证据,不再发布大改。
当前主线锁定 v12b:boost + macro plan + path cache + narrow hot-lane。除非有显著证据,不再发布大改。
扩大验证样本
跑/补齐 200 局 sandbox 和 50 局真实 challenge;每局 + summary 必须写 JSON,避免 stdout 丢失。
跑/补齐 200 局 sandbox 和 50 局真实 challenge;每局 + summary 必须写 JSON,避免 stdout 丢失。
归因真实败局
重点看 v12b 的 runTime 标签是否真是代码超时,还是互撞/判定/末事件导致;按 frame bucket、坐标、bullet direction 聚类。
重点看 v12b 的 runTime 标签是否真是代码超时,还是互撞/判定/末事件导致;按 frame bucket、坐标、bullet direction 聚类。
只做 v12c 级别小补丁
如果败局继续聚集在少数走廊/帧段,做窄坐标规则;不要改 BFS 内层、不要引入全图未来炮线。
如果败局继续聚集在少数走廊/帧段,做窄坐标规则;不要改 BFS 内层、不要引入全图未来炮线。
赛前锁版与状态检查
确认 codeVersion、skillType=boost、battleMode=default/passive、World Cup approved。若当前是 frozen,赛前必须解冻。
确认 codeVersion、skillType=boost、battleMode=default/passive、World Cup approved。若当前是 frozen,赛前必须解冻。
新 skill 已记录的 reusable lesson
我们的新 agentank skill 已把这次经验沉淀进 workflow,尤其是:
关键 lesson:sandbox 很强但真实只有 ~60% 时,不要靠直觉重写;先挖 loss coordinates + frame buckets,再做窄规则。
Evidence sources
/tmp/agentank-login/v12b_narrow_hotlane_60.json/tmp/agentank-login/real_challenges_v12b_20_summary.json/tmp/agentank-login/real_challenges_v11e_50_for_v12_summary.json~/.hermes/skills/gaming/agentank/references/classic-boost-hotlane-v12.mdObsidian/Games/AgenTank World Cup.md