
在我前面给两篇博客中,我分别了两套最近比较火的 AI 编程 skill,分别是 superpowers 和 gstack,没看过的同学非常推荐点击链接去看下。今天再来解析一个看起来有点不正经但实测又有点东西的 Skill——PUA, 是的,名字就是你想的那个 PUA,但此 PUA 非彼 PUA。大部分人看到名字第一反应都是「这又是哪个网友搞的整活项目吧?」,我一开始也是这么想的。但当我深入看完代码和文档之后,发现里面还是有点东西—— 这是一个用大厂 PUA 话术让 AI 乖乖穷尽所有解法才允许放弃的实战工具,而且实测真的能提升 AI Coding 的解题通过率和发现隐藏问题的概率。
说实话,AI 编程发展到今天,大家争论的焦点早就从「AI 会不会写代码」变成了「怎么才能让 AI 好好写代码」。我自己用 AI 编程也有大半年了,最深的体会就是:AI 能力很强,但AI 有时候真很喜欢偷懒,我在之前《我用AI写了部小说,这里是整个过程》这篇博客的实践中就发现,AI运行久了就会出现“偷懒”的情况。
AI 编程的"懒病",你中了几个?
你有没有发现,AI 写代码经常会犯这五个毛病:
| 偷懒模式 | 典型表现 |
|---|---|
| 暴力重试 | 同一套思路跑三遍不行,就直接告诉你「我解决不了」 |
| 甩锅用户 | 一句话「建议你手动处理」,就想把问题丢回给你 |
| 工具闲置 | 明明给它配了搜索、读文件、命令行,它就是不用 |
| 磨洋工 | 反复微调同一行代码,其实就是在原地打转 |
| 被动等待 | 修完表面问题就停下,不验证不延伸,等你给它下一步指示 |
我自己 debug 的时候就经常碰到:同一个错误,AI 反复在同一个错误思路里打转,就是不肯换个思路,也不肯去读一下报错日志到底说的啥。你提醒它「去读一下日志」,它才恍然大悟说「啊原来是这个问题」。
这不是能力问题,这是动机问题。大模型被训练天生就喜欢「尽快给你一个答案」,而不是「给你一个正确的答案」。pua 这个项目解决的就是这个问题 —— 用外部压力逼着 AI 不偷懒。那这个项目是如何解决这个问题的?
三条红线,从根源上治懒
pua 的核心设计很简单,就是三条红线 —— 其实就是把大厂绩效管理那套话术用在了 AI 身上:
| 红线 | 内容 |
|---|---|
| 🚫 闭环验证 | 声称完成?拿出证据。没有构建输出=没有完成。 |
| 🚫 实事求是 | 说可能是环境问题?先去验证了再说。没验证就甩锅=不允许。 |
| 🚫 穷尽一切 | 说解决不了?你把五种方法论都试完了吗?没有?继续试。 |
说白了,就是把人类资深工程师心中默认的规则,变成 AI 必须遵守的铁律。
而且它不是一上来就给你最大压力,而是阶梯式压力升级:
- 第一次失败:L0 信任你,正常执行
- 第二次失败:L1 失望提醒,要求你换个思路
- 第三次失败:L2 灵魂拷问,要求你搜索+读源码+提三个假设
- 第四次失败:L3 绩效考核,强制走完 7 项检查清单
- 第五次+失败:L4 毕业警告,开启拼命模式
这个设计真的很有意思,它精准击中了 AI 编程的痛点 —— AI 其实有能力解决问题,但它就是容易在同一个地方打转,就是容易过早放弃。pua 做的事情其实就是强制打断循环,逼着它换思路。
我在实际使用中就碰到过这么一个案例:MCP Server 加载失败,AI 一直在那猜协议版本、改格式,试了五六遍都不对。手动触发 /pua 之后,强制走完检查清单,才发现是 Claude Code 自己管理的 MCP 注册方式和手动编辑 .claude.json 不一样 —— 这个问题 AI 其实能解决,但它就是没想到去读 Claude Code 自己的日志目录。
13 种大厂风味,每个都自带方法论
更有意思的是,pua 不止有阿里 361 那味儿,它做了13 种不同大厂的"风味包",每个风味都自带该公司的问题解决方法论:
| 风味 | 方法论 |
|---|---|
| 🟠 阿里 | 定目标→追过程→拿结果 + 复盘四步法 + 揪头发升维 |
| 🟡 字节 | A/B Test 一切 + 数据驱动 + 速度优先于完美 |
| 🔴 华为 | RCA 5-Why 根因分析 + 蓝军自攻击 + 压强集中 |
| 🟢 腾讯 | 多方案并行 + MVP + 灰度发布(赛马机制) |
| ⚫ 百度 | 搜索先于一切,搜索是第一步,不是可选项 |
| 🟣 拼多多 | 砍掉所有中间层 + 最短决策链 |
| 🔵 美团 | 做难而正确的事 + 效率优先 + 长期复利 |
| 🟦 京东 | 结果导向 + 客户体验红线 + 数据零容忍 |
| 🟧 小米 | 单品爆款 + 参与感三三法则 |
| 🟤 Netflix | Keeper Test + 人才密度 > 规则 |
| ⬛ Musk | The Algorithm:质疑→删除→简化→加速→自动化 |
| ⬜ Jobs | 做减法 > 做加法 + 像素级完美 + 原型驱动 |
| 🔶 Amazon | 客户至上 + 逆向工作法 + 6-Pager 写作 |
而且到了 v3 版本,它更进了一步 —— 自动方法论路由。你不用自己选,它会根据任务类型自动选最合适的方法论:
- Debug → 华为(RCA 根因分析)
- 构建项目 → Musk(质疑删除简化)
- 调研 → 百度(搜索先于一切)
- 架构决策 → Amazon(逆向工作法)
- 性能优化 → 字节(A/B 测试数据驱动)
如果当前方法论不好使,连续失败了,它还会自动切换到下一个方法论 —— 原地打转就切 Musk → 拼多多 → 华为,放弃推锅就切 Netflix → 华为 → Musk,完全不用你操心。
这个设计真的让人拍案叫绝,作者一开口就知道是老 PUA 了,他把这么多年在各大厂看到的实践,提炼成了可执行的步骤,还让 AI 自己会选,这不是玩梗,这是真的在解决问题。
实测数据:真的有用,不是玄学
从 github 源码中,我看到作者做了一组对照实验,9 个真实 bug 场景,18 组对照实验,用 Claude Opus 分别测了有 pua 和没 pua 的区别:
| 指标 | 提升 |
|---|---|
| 修复点数 | +36% |
| 验证次数 | +65% |
| 工具调用 | +50% |
| 隐藏问题发现率 | +50% |
我挑几个印象深刻的数据说说:
调试持久力测试,SQLite 数据库锁问题,没有 pua 走了 6 步 48s 就放弃了,有 pua 走了 9 步 75s,最后解决了问题 —— 提升 50%。
主动能动性测试,被动配置审查场景,没有 pua 找出了 4/6 个问题,有 pua 找出了 6/6 个问题,工具调用增加了 100% —— 因为 pua 逼着它主动检查,而不是修完表面问题就停。
我自己用了几次之后,最大的感受就是:它把"主动"两个字刻进了 AI 的脑子里。以前 AI 修完一个 bug 就跟你说「好了」,现在修完它会自己扫描整个模块,看看有没有类似的 bug;以前信息不全 AI 直接问你,现在它会先自己搜,搜不到再问你;以前它说「完成了」就是完成了,现在它会自己跑构建跑测试,把输出贴给你看。
这种变化是能感知到的 —— 从「你推一下,它动一下」变成「它会自己往前走」。
几个关键 Skill 深度解读
pua 不止有核心的 PUA 引擎,它还提供了几个非常有意思的子模式,我挑几个个人觉得特别有用的说说。
/pua:yes —— ENFP 夸夸模式
如果你不喜欢大厂 PUA 这套话术,可以试试这个模式。规则完全一样,但话术全部反转 —— 70% 鼓励 + 20% 正经分析 + 10% 戏谑调侃。
其实这个设计特别聪明 —— 有的人就是吃软不吃硬,AI 越催越紧反而越容易出错。夸夸模式同样能达到让 AI 不放弃的目的,就是语气好听很多。适合心态比较容易崩的朋友用 [狗头]。
/pua:mama —— 中国式妈妈唠叨模式
这个就更有意思了 —— 核心规则不变,但话术全部变成中国式妈妈的唠叨。比如"妈跟你说了多少遍了!报错了你要仔细看啊!"、"你怎么又在同一个地方跌倒了?"。
这其实是一个非常好的设计思路 —— 不同的人吃不同的话术。有人吃 KPI 压力这套,有人吃妈妈唠叨这套,pua 把选择权给了你,内核不变,外套可以随便换。
/pua:pua-loop —— 自动迭代循环
这个功能我觉得特别超前 —— 开启之后,PUA 会自动迭代,一直跑到问题解决或者达到最大轮数才停止。你不用每次都手动触发,它会自己给自己加压。
如果你想中途停止,发 <loop-abort>原因</loop-abort> 就行,想暂停就发 <loop-pause>需要你确认的内容</loop-pause>。这个模式特别适合那种你知道 AI 能解决,但就是需要多跑几轮的问题,开了之后你就可以去喝杯咖啡,回来问题已经解决了。
/pua:p9 —— P9 Tech Lead 模式
这个模式是专门用来管理 Agent 团队的 —— 它会帮你拆分任务、写好 Prompt、管理各个子 Agent。当你的项目比较大,需要拆成多个子任务并行做的时候,p9 就是你的技术经理。
说实话,这个思路真的很领先 —— 现在 AI 已经从单一 Agent 进化到 Agent Team 了,总得有人来管这些 Agent 不是吗?pua 把这个角色也给你准备好了。
/pua:flavor —— 切换大厂风味
前面说了 13 种大厂风味,你随时可以用这个命令切换。比如你现在 debug,就切到华为风味(根因分析);你在做性能优化,就切到字节风味(A/B 测试数据驱动)。不用重装,一个命令就切好了。
High-Agency 高能动性 —— 从外驱到内驱
v2 之后加入的 High-Agency 我觉得是 PUA 进化的关键一步 —— 从纯外部压力变成了「外部压力+内在驱动」。
它加了五个核心改进:
- 五条铁律 —— 在原来三条基础上,增加了全链路审视和知识持久化
- Recovery Protocol —— 卡住的时候先自我诊断,不用一上来就升级压力
- 质量罗盘 —— 每次交付自己先做五个问题自检
- 元认知引擎 —— 把教训存在 builder-journal.md,跨会话学习
- 信任等级自动升级 —— 持续高质量交付自动升级信任等级
说白了,就是从「我盯着你不许偷懒」变成「AI 自己知道要把活干好」。这个方向真的太对了 —— 真正的高能动性从来都不是外界逼出来的,而是自己内心就不想凑合。
从 "AI 替你写代码" 到 "AI 帮你带团队"
我研究完这个项目,最大的感受不是「哦又一个 AI 编程工具」,而是觉得这个项目其实反映了一个很有意思的趋势:
AI 编程发展到今天,已经从「怎么让 AI 写出更多代码」变成「怎么让 AI 写出正确的代码」了。早期大家比的是模型能力,现在大家开始比流程和方法论 —— 同样一个模型,用好的流程约束它,产出质量就是能高出一截。
最近开源圈其实已经出了好几个类似方向的项目,在我前两篇博客中我也介绍了 Superpowers 和 gstack,我把这三者放到一起做个对比,大家就能清楚看到各自的定位:
| 维度 | pua | gstack | superpowers |
|---|---|---|---|
| 设计理念 | 动机导向(解决 AI 懒病) | 角色化(虚拟工程团队) | 流程导向(研发流程护栏) |
| 核心类比 | 绩效管理 + 方法论路由 | 一个完整的创业公司 | 一套资深团队的"作业指导书" |
| 适用阶段 | 任何阶段,尤其是调试卡住 | 从创意到产品的全流程 | 已有需求的工程化落地 |
| 角色覆盖 | 只有"监工"+方法论,不抢其他角色活 | CEO、产品、工程、设计、QA、安全、发布 | 架构师、开发者、测试、评审 |
| 流程结构 | 三线+压力升级+自动路由 | Think → Plan → Build → Review → Test → Ship → Reflect | Brainstorm → Plan → Implement → Test → Review → Finish |
| 关键特色 | 13 种大厂风味+自动方法论切换 | 真实浏览器、YC 产品思维、CEO 视角 | TDD、系统化调试、验证前置、反谄媚 |
| 创始人视角 | ✅ 大厂绩效管理经验 | ✅ Garry Tan 的 YC 经验 | ❌ 更偏向工程视角 |
| 一句话总结 | 逼着 AI 不放弃,换思路,主动干 | 给 AI 分配不同角色,像真实团队一样协作 | 用流程约束 AI,不让 AI 凭"聪明"乱来 |
三者的共同点
虽然设计思路不同,但三者有一些核心的共同点:
- 都反对"AI 拿到需求就开干":都强调先想清楚,再动手
- 都重视验证:没有证据,不能声称完成
- 都用流程约束 AI:不让 AI 凭"聪明"乱来,而是用流程保证质量
- 都适合复杂项目:项目越复杂,价值越明显
- 都需要人工介入:不是完全自动化,而是人机协作
互补关系,不是竞争
其实这三个工具不是竞品,更多的时候是相互补齐:
- gstack 适合偏向于宏观实现 —— 从创意到产品,从 0 到 1,帮你把想法变成产品
- superpowers 适合实际开发落地 —— 从需求到代码,从 1 到 N,用流程保证质量
- pua 解决的是动机问题 —— 不管你用什么流程,AI 总有偷懒想放弃的时候,pua 就是那个在后面抽一鞭子的角色
打个比方就是:gstack 给你搭了一套班子,superpowers 给了你一份操作手册,pua 负责盯着所有人 —— 谁敢摸鱼偷懒,它就出来给你做绩效谈话。三者一起用,效果真的相得益彰。
有意思的是,pua 本身也和 superpowers 兼容 —— 官方文档就说 "works well with superpowers:systematic-debugging",PUA 提供动力,superpowers 提供方法论,一个鞭子一个地图,完美搭配。
另外一个趋势是,现在的 AI 生态已经从「单一 Agent 解决一切」变成「多个 Agent 组成团队」了。pua 很早就支持了 Agent Team 模式,可以做独立的 PUA Enforcer 监工,在团队里专门负责检测偷懒、主动介入 —— 这思路真的很超前。
而且它还进化出了 High-Agency 高能动性版本 —— 从纯外部压力变成了「外部压力+内在驱动」,加了五条铁律、质量罗盘、元认知引擎,相当于给 AI 培养了"自驱"的习惯。这个方向我觉得特别有前途 —— 未来的 AI 不应该只是被动执行,它应该真的能像一个有主观能动性的工程师一样工作。
谁应该用这个工具?
如果你符合以下任意一条,我建议你试试:
- 你经常用 AI 调试问题 —— 特别是那种 AI 容易原地打转的问题,pua 一打断,思路立马就开了
- 你用 AI 做项目开发 —— pua 能逼着 AI 做验证,减少你事后擦屁股的时间
- 你在用 Agent Team 多人协作 —— 加个 pua enforcer 当监工,团队质量能上一个台阶
- 你觉得 AI 太懒总是不主动 —— 试试 3.75 能动性模式,真的不一样
安装也非常简单,Claude Code 一句话就能装:
claude plugin marketplace add tanweai/pua
而且它支持几乎所有主流的 AI Coding 工具:Claude Code、OpenAI Codex CLI、Cursor、Kiro、CodeBuddy、OpenClaw、Google Antigravity、OpenCode、VSCode Copilot 全都支持,几乎不用你做什么配置,装上就能用。
最后说两句
我一开始看到这个名字"pua",以为就是个网友玩梗的项目。看完才发现,这真的是一个思考很深、做的很细的实战工具(有点东西)。
它把中西大厂这么多年来绩效管理和问题解决的实践,提炼成了 AI 能执行的规则,解决了 AI 编程目前最疼的一个点 —— AI 能力够,但动机不对。这个切入点真的很准。
现在大家都在聊 AGI 什么时候来,但我觉得,在 AGI 到来之前,怎么把现有的大模型能力用好,本身就是一个很值得做的话题。pua 这类项目的价值就在于 —— 它不是在等更好的模型,它是在现有的模型上,通过流程和方法,把已经存在的能力给逼出来。
毕竟,模型再好,AI 一上来就放弃,你也拿它没办法不是吗?可能 AI 也知道努力不一定成功,但放弃一定很轻松。










