AI 也会偷懒？这个 PUA 工具专治“摸鱼式编程”

在我前面给两篇博客中，我分别了两套最近比较火的 AI 编程 skill，分别是 superpowers 和 gstack，没看过的同学非常推荐点击链接去看下。今天再来解析一个看起来有点不正经但实测又有点东西的 Skill——PUA，是的，名字就是你想的那个 PUA，但此 PUA 非彼 PUA。大部分人看到名字第一反应都是「这又是哪个网友搞的整活项目吧？」，我一开始也是这么想的。但当我深入看完代码和文档之后，发现里面还是有点东西—— 这是一个用大厂 PUA 话术让 AI 乖乖穷尽所有解法才允许放弃的实战工具，而且实测真的能提升 AI Coding 的解题通过率和发现隐藏问题的概率。

说实话，AI 编程发展到今天，大家争论的焦点早就从「AI 会不会写代码」变成了「怎么才能让 AI 好好写代码」。我自己用 AI 编程也有大半年了，最深的体会就是：AI 能力很强，但AI 有时候真很喜欢偷懒，我在之前《我用AI写了部小说，这里是整个过程》这篇博客的实践中就发现，AI运行久了就会出现“偷懒”的情况。

AI 编程的"懒病"，你中了几个？

你有没有发现，AI 写代码经常会犯这五个毛病：

偷懒模式	典型表现
暴力重试	同一套思路跑三遍不行，就直接告诉你「我解决不了」
甩锅用户	一句话「建议你手动处理」，就想把问题丢回给你
工具闲置	明明给它配了搜索、读文件、命令行，它就是不用
磨洋工	反复微调同一行代码，其实就是在原地打转
被动等待	修完表面问题就停下，不验证不延伸，等你给它下一步指示

我自己 debug 的时候就经常碰到：同一个错误，AI 反复在同一个错误思路里打转，就是不肯换个思路，也不肯去读一下报错日志到底说的啥。你提醒它「去读一下日志」，它才恍然大悟说「啊原来是这个问题」。

这不是能力问题，这是动机问题。大模型被训练天生就喜欢「尽快给你一个答案」，而不是「给你一个正确的答案」。pua 这个项目解决的就是这个问题 —— 用外部压力逼着 AI 不偷懒。那这个项目是如何解决这个问题的？

三条红线，从根源上治懒

pua 的核心设计很简单，就是三条红线 —— 其实就是把大厂绩效管理那套话术用在了 AI 身上：

红线	内容
🚫 闭环验证	声称完成？拿出证据。没有构建输出=没有完成。
🚫 实事求是	说可能是环境问题？先去验证了再说。没验证就甩锅=不允许。
🚫 穷尽一切	说解决不了？你把五种方法论都试完了吗？没有？继续试。

说白了，就是把人类资深工程师心中默认的规则，变成 AI 必须遵守的铁律。

而且它不是一上来就给你最大压力，而是阶梯式压力升级：

第一次失败：L0 信任你，正常执行
第二次失败：L1 失望提醒，要求你换个思路
第三次失败：L2 灵魂拷问，要求你搜索+读源码+提三个假设
第四次失败：L3 绩效考核，强制走完 7 项检查清单
第五次+失败：L4 毕业警告，开启拼命模式

这个设计真的很有意思，它精准击中了 AI 编程的痛点 —— AI 其实有能力解决问题，但它就是容易在同一个地方打转，就是容易过早放弃。pua 做的事情其实就是强制打断循环，逼着它换思路。

我在实际使用中就碰到过这么一个案例：MCP Server 加载失败，AI 一直在那猜协议版本、改格式，试了五六遍都不对。手动触发 /pua 之后，强制走完检查清单，才发现是 Claude Code 自己管理的 MCP 注册方式和手动编辑 .claude.json 不一样 —— 这个问题 AI 其实能解决，但它就是没想到去读 Claude Code 自己的日志目录。

13 种大厂风味，每个都自带方法论

更有意思的是，pua 不止有阿里 361 那味儿，它做了13 种不同大厂的"风味包"，每个风味都自带该公司的问题解决方法论：

风味	方法论
🟠 阿里	定目标→追过程→拿结果 + 复盘四步法 + 揪头发升维
🟡 字节	A/B Test 一切 + 数据驱动 + 速度优先于完美
🔴 华为	RCA 5-Why 根因分析 + 蓝军自攻击 + 压强集中
🟢 腾讯	多方案并行 + MVP + 灰度发布（赛马机制）
⚫ 百度	搜索先于一切，搜索是第一步，不是可选项
🟣 拼多多	砍掉所有中间层 + 最短决策链
🔵 美团	做难而正确的事 + 效率优先 + 长期复利
🟦 京东	结果导向 + 客户体验红线 + 数据零容忍
🟧 小米	单品爆款 + 参与感三三法则
🟤 Netflix	Keeper Test + 人才密度 > 规则
⬛ Musk	The Algorithm：质疑→删除→简化→加速→自动化
⬜ Jobs	做减法 > 做加法 + 像素级完美 + 原型驱动
🔶 Amazon	客户至上 + 逆向工作法 + 6-Pager 写作

而且到了 v3 版本，它更进了一步 —— 自动方法论路由。你不用自己选，它会根据任务类型自动选最合适的方法论：

Debug → 华为（RCA 根因分析）
构建项目 → Musk（质疑删除简化）
调研 → 百度（搜索先于一切）
架构决策 → Amazon（逆向工作法）
性能优化 → 字节（A/B 测试数据驱动）

如果当前方法论不好使，连续失败了，它还会自动切换到下一个方法论 —— 原地打转就切 Musk → 拼多多 → 华为，放弃推锅就切 Netflix → 华为 → Musk，完全不用你操心。

这个设计真的让人拍案叫绝，作者一开口就知道是老 PUA 了，他把这么多年在各大厂看到的实践，提炼成了可执行的步骤，还让 AI 自己会选，这不是玩梗，这是真的在解决问题。

实测数据：真的有用，不是玄学

从 github 源码中，我看到作者做了一组对照实验，9 个真实 bug 场景，18 组对照实验，用 Claude Opus 分别测了有 pua 和没 pua 的区别：

指标	提升
修复点数	+36%
验证次数	+65%
工具调用	+50%
隐藏问题发现率	+50%

我挑几个印象深刻的数据说说：

调试持久力测试，SQLite 数据库锁问题，没有 pua 走了 6 步 48s 就放弃了，有 pua 走了 9 步 75s，最后解决了问题 —— 提升 50%。

主动能动性测试，被动配置审查场景，没有 pua 找出了 4/6 个问题，有 pua 找出了 6/6 个问题，工具调用增加了 100% —— 因为 pua 逼着它主动检查，而不是修完表面问题就停。

我自己用了几次之后，最大的感受就是：它把"主动"两个字刻进了 AI 的脑子里。以前 AI 修完一个 bug 就跟你说「好了」，现在修完它会自己扫描整个模块，看看有没有类似的 bug；以前信息不全 AI 直接问你，现在它会先自己搜，搜不到再问你；以前它说「完成了」就是完成了，现在它会自己跑构建跑测试，把输出贴给你看。

这种变化是能感知到的 —— 从「你推一下，它动一下」变成「它会自己往前走」。

几个关键 Skill 深度解读

pua 不止有核心的 PUA 引擎，它还提供了几个非常有意思的子模式，我挑几个个人觉得特别有用的说说。

`/pua:yes` —— ENFP 夸夸模式

如果你不喜欢大厂 PUA 这套话术，可以试试这个模式。规则完全一样，但话术全部反转 —— 70% 鼓励 + 20% 正经分析 + 10% 戏谑调侃。

其实这个设计特别聪明 —— 有的人就是吃软不吃硬，AI 越催越紧反而越容易出错。夸夸模式同样能达到让 AI 不放弃的目的，就是语气好听很多。适合心态比较容易崩的朋友用 [狗头]。

`/pua:mama` —— 中国式妈妈唠叨模式

这个就更有意思了 —— 核心规则不变，但话术全部变成中国式妈妈的唠叨。比如"妈跟你说了多少遍了！报错了你要仔细看啊！"、"你怎么又在同一个地方跌倒了？"。

这其实是一个非常好的设计思路 —— 不同的人吃不同的话术。有人吃 KPI 压力这套，有人吃妈妈唠叨这套，pua 把选择权给了你，内核不变，外套可以随便换。

`/pua:pua-loop` —— 自动迭代循环

这个功能我觉得特别超前 —— 开启之后，PUA 会自动迭代，一直跑到问题解决或者达到最大轮数才停止。你不用每次都手动触发，它会自己给自己加压。

如果你想中途停止，发 <loop-abort>原因</loop-abort> 就行，想暂停就发 <loop-pause>需要你确认的内容</loop-pause>。这个模式特别适合那种你知道 AI 能解决，但就是需要多跑几轮的问题，开了之后你就可以去喝杯咖啡，回来问题已经解决了。

`/pua:p9` —— P9 Tech Lead 模式

这个模式是专门用来管理 Agent 团队的 —— 它会帮你拆分任务、写好 Prompt、管理各个子 Agent。当你的项目比较大，需要拆成多个子任务并行做的时候，p9 就是你的技术经理。

说实话，这个思路真的很领先 —— 现在 AI 已经从单一 Agent 进化到 Agent Team 了，总得有人来管这些 Agent 不是吗？pua 把这个角色也给你准备好了。

`/pua:flavor` —— 切换大厂风味

前面说了 13 种大厂风味，你随时可以用这个命令切换。比如你现在 debug，就切到华为风味（根因分析）；你在做性能优化，就切到字节风味（A/B 测试数据驱动）。不用重装，一个命令就切好了。

High-Agency 高能动性 —— 从外驱到内驱

v2 之后加入的 High-Agency 我觉得是 PUA 进化的关键一步 —— 从纯外部压力变成了「外部压力+内在驱动」。

它加了五个核心改进：

五条铁律 —— 在原来三条基础上，增加了全链路审视和知识持久化
Recovery Protocol —— 卡住的时候先自我诊断，不用一上来就升级压力
质量罗盘 —— 每次交付自己先做五个问题自检
元认知引擎 —— 把教训存在 builder-journal.md，跨会话学习
信任等级自动升级 —— 持续高质量交付自动升级信任等级

说白了，就是从「我盯着你不许偷懒」变成「AI 自己知道要把活干好」。这个方向真的太对了 —— 真正的高能动性从来都不是外界逼出来的，而是自己内心就不想凑合。

从 "AI 替你写代码" 到 "AI 帮你带团队"

我研究完这个项目，最大的感受不是「哦又一个 AI 编程工具」，而是觉得这个项目其实反映了一个很有意思的趋势：

AI 编程发展到今天，已经从「怎么让 AI 写出更多代码」变成「怎么让 AI 写出正确的代码」了。早期大家比的是模型能力，现在大家开始比流程和方法论 —— 同样一个模型，用好的流程约束它，产出质量就是能高出一截。

最近开源圈其实已经出了好几个类似方向的项目，在我前两篇博客中我也介绍了 Superpowers 和 gstack，我把这三者放到一起做个对比，大家就能清楚看到各自的定位：

维度	pua	gstack	superpowers
设计理念	动机导向（解决 AI 懒病）	角色化（虚拟工程团队）	流程导向（研发流程护栏）
核心类比	绩效管理 + 方法论路由	一个完整的创业公司	一套资深团队的"作业指导书"
适用阶段	任何阶段，尤其是调试卡住	从创意到产品的全流程	已有需求的工程化落地
角色覆盖	只有"监工"+方法论，不抢其他角色活	CEO、产品、工程、设计、QA、安全、发布	架构师、开发者、测试、评审
流程结构	三线+压力升级+自动路由	Think → Plan → Build → Review → Test → Ship → Reflect	Brainstorm → Plan → Implement → Test → Review → Finish
关键特色	13 种大厂风味+自动方法论切换	真实浏览器、YC 产品思维、CEO 视角	TDD、系统化调试、验证前置、反谄媚
创始人视角	✅ 大厂绩效管理经验	✅ Garry Tan 的 YC 经验	❌ 更偏向工程视角
一句话总结	逼着 AI 不放弃，换思路，主动干	给 AI 分配不同角色，像真实团队一样协作	用流程约束 AI，不让 AI 凭"聪明"乱来

三者的共同点

虽然设计思路不同，但三者有一些核心的共同点：

都反对"AI 拿到需求就开干"：都强调先想清楚，再动手
都重视验证：没有证据，不能声称完成
都用流程约束 AI：不让 AI 凭"聪明"乱来，而是用流程保证质量
都适合复杂项目：项目越复杂，价值越明显
都需要人工介入：不是完全自动化，而是人机协作

互补关系，不是竞争

其实这三个工具不是竞品，更多的时候是相互补齐：

gstack 适合偏向于宏观实现 —— 从创意到产品，从 0 到 1，帮你把想法变成产品
superpowers 适合实际开发落地 —— 从需求到代码，从 1 到 N，用流程保证质量
pua 解决的是动机问题 —— 不管你用什么流程，AI 总有偷懒想放弃的时候，pua 就是那个在后面抽一鞭子的角色

打个比方就是：gstack 给你搭了一套班子，superpowers 给了你一份操作手册，pua 负责盯着所有人 —— 谁敢摸鱼偷懒，它就出来给你做绩效谈话。三者一起用，效果真的相得益彰。

有意思的是，pua 本身也和 superpowers 兼容 —— 官方文档就说 "works well with superpowers:systematic-debugging"，PUA 提供动力，superpowers 提供方法论，一个鞭子一个地图，完美搭配。

另外一个趋势是，现在的 AI 生态已经从「单一 Agent 解决一切」变成「多个 Agent 组成团队」了。pua 很早就支持了 Agent Team 模式，可以做独立的 PUA Enforcer 监工，在团队里专门负责检测偷懒、主动介入 —— 这思路真的很超前。

而且它还进化出了 High-Agency 高能动性版本 —— 从纯外部压力变成了「外部压力+内在驱动」，加了五条铁律、质量罗盘、元认知引擎，相当于给 AI 培养了"自驱"的习惯。这个方向我觉得特别有前途 —— 未来的 AI 不应该只是被动执行，它应该真的能像一个有主观能动性的工程师一样工作。

谁应该用这个工具？

如果你符合以下任意一条，我建议你试试：

你经常用 AI 调试问题 —— 特别是那种 AI 容易原地打转的问题，pua 一打断，思路立马就开了
你用 AI 做项目开发 —— pua 能逼着 AI 做验证，减少你事后擦屁股的时间
你在用 Agent Team 多人协作 —— 加个 pua enforcer 当监工，团队质量能上一个台阶
你觉得 AI 太懒总是不主动 —— 试试 3.75 能动性模式，真的不一样

安装也非常简单，Claude Code 一句话就能装：

claude plugin marketplace add tanweai/pua

而且它支持几乎所有主流的 AI Coding 工具：Claude Code、OpenAI Codex CLI、Cursor、Kiro、CodeBuddy、OpenClaw、Google Antigravity、OpenCode、VSCode Copilot 全都支持，几乎不用你做什么配置，装上就能用。

最后说两句

我一开始看到这个名字"pua"，以为就是个网友玩梗的项目。看完才发现，这真的是一个思考很深、做的很细的实战工具（有点东西）。

它把中西大厂这么多年来绩效管理和问题解决的实践，提炼成了 AI 能执行的规则，解决了 AI 编程目前最疼的一个点 —— AI 能力够，但动机不对。这个切入点真的很准。

现在大家都在聊 AGI 什么时候来，但我觉得，在 AGI 到来之前，怎么把现有的大模型能力用好，本身就是一个很值得做的话题。pua 这类项目的价值就在于 —— 它不是在等更好的模型，它是在现有的模型上，通过流程和方法，把已经存在的能力给逼出来。

毕竟，模型再好，AI 一上来就放弃，你也拿它没办法不是吗？可能 AI 也知道努力不一定成功，但放弃一定很轻松。

AI 也会偷懒？这个 PUA 工具专治“摸鱼式编程”

AI 编程的"懒病"，你中了几个？

三条红线，从根源上治懒

13 种大厂风味，每个都自带方法论

实测数据：真的有用，不是玄学