AgenTank World Cup · current operating plan

Roadmap & Current Strategy

TL;DR：当前策略是 保持 boost / codeVersion 7 / v12b narrow hot-lane。不换技能、不追求炮战，继续用实证数据判断是否需要 v12c；赛前重点是稳定性与解冻确认。

Current releasecodeVersion 7 / v12b

Skillboost

Mapclassic

DecisionHold, don’t switch

核心结论

现在的最优策略不是继续发明大策略，而是锁住 v12b，验证真实败局，再做极小补丁。

59/60

98.3%, Wilson 95% CI ≈ 91.1%–99.7%

~254ms

p95 ~488ms, max ~552ms, errors 0

13/20

65%; losses: runTime 4, crashed 3

Layer	What it does
Macro plan	按开局星星距离选择 `race` / `ambush` / `block`，核心仍是抢星节奏。
Path cache	缓存重复 `pathDistance(...)`，降低 runtime，不改变战术。
Aim-lane guard	避免进入敌方当前朝向的无遮挡炮线，保护 boost / 前进动作。
v12b hot-lane guard	只在 frame 20–80，对重复死亡走廊做窄规则保护：左侧 `x=4–9,y=8/10`；右侧 `x=13–16,y=7`。
Persona	保留 Star-Poet speak；不让创意文本影响胜率主轴。

Freeze strategy scope
当前主线锁定 v12b：boost + macro plan + path cache + narrow hot-lane。除非有显著证据，不再发布大改。

扩大验证样本
跑/补齐 200 局 sandbox 和 50 局真实 challenge；每局 + summary 必须写 JSON，避免 stdout 丢失。

归因真实败局
重点看 v12b 的 runTime 标签是否真是代码超时，还是互撞/判定/末事件导致；按 frame bucket、坐标、bullet direction 聚类。

只做 v12c 级别小补丁
如果败局继续聚集在少数走廊/帧段，做窄坐标规则；不要改 BFS 内层、不要引入全图未来炮线。

赛前锁版与状态检查
确认 codeVersion、skillType=boost、battleMode=default/passive、World Cup approved。若当前是 frozen，赛前必须解冻。

我们的新 agentank skill 已把这次经验沉淀进 workflow，尤其是：

real challenge pressure testing classic boost hot-lane v12 runtime planning cache community replay mining

关键 lesson：sandbox 很强但真实只有 ~60% 时，不要靠直觉重写；先挖 loss coordinates + frame buckets，再做窄规则。