同一周,8000万人被AI震撼,全网却在笑AI要推车
上周,两条帖子分别在中英文互联网上爆了。
英文 X 上,AI 创业者 Matt Shumer 发了一篇长文 “Something Big Is Happening“,截至目前阅读量超过 8000 万。他在 AI 行业做了六年,一直给身边圈外的朋友和家人讲”客气版本”,但最近几个月发生的事让他觉得不能再藏了。他说自己的技术工作已经被 AI 完全替代:”我描述想要什么,走开四小时,回来发现做完了。做得比我自己做的还好,不需要任何修正。” 他还说最新的 AI 模型展现出了一种他称之为”判断力”和”品味”的东西——会自己打开应用、测试功能、发现不满意自己回去改,直到满意了才交给你验收。他用 COVID 疫情做类比:我们正处在 2020 年 2 月那个”这事被夸大了”的阶段,只不过这次来的不是病毒,而是比病毒影响更深远的东西。
同一周,中文社交媒体上最火的 AI 内容是一道”小学题”——“我想去洗车,洗车店距离我家50米,开车去还是走过去?” 各大 AI 的回答被做成合集传播:豆包说走路,ChatGPT 说走路,DeepSeek 说走路,Gemini 说开车,GLM-5 说推车。评论区笑成一片。

一边是”AI 已经在做我的工作了”。一边是”AI 连 50 米该走路还是开车都搞不清”。
谁对了?都对。
AI 的能力是”锯齿状”的
这种看似矛盾的现象有个精准的概念:锯齿状智力(jagged intelligence)。
AI 的能力不是一条平滑上升的曲线,而是一把锯齿刀。某些维度已经超越大多数人类专家,某些维度不如一个小学生。一个经典的例子:让 AI 数 “strawberry” 里有几个字母 r,它可能数错。但让它用莎士比亚风格写一首关于数 r 有多难的十四行诗,每行首字母还要拼成藏头诗,它能完美完成。
不是 bug。是 AI 的底层特质。
理解这个特质,上面两条帖子就不矛盾了。它们说的是同一把锯齿刀的两面。
“强”的那一面,到底有多强?
先说我自己的经历。
作为一位从技术转到产品经理赛道的PM,我已经有二十多年没写过代码。但过去两个月,我用 Claude Code 做到了这些事:直接修改前后端代码,搭建自动化测试框架,处理多语言国际化等等。
一个多年不写代码的 PM,靠着和 AI 协作,走完了从竞品分析到代码提交和自动化验证的全流程。Claude Code 在分析我的使用数据后有这样一段评价:”你已经开发出了一套独特的’PM即开发者’工作流程,能够利用 Claude 从竞品分析和设计综合一直到提交代码和文档编写的全过程——这种紧密循环是大多数产品经理都无法实现的。”
我不是个例。前面提到的 Matt Shumer 在 AI 行业摸爬滚打了六年,他说以前还需要跟 AI 来回反复修改、引导。现在不需要了。描述目标,走开,回来验收成品。他的判断是:如果你的工作主要在电脑屏幕上完成——读、写、分析、决策、沟通——那么 AI 正在逼近你工作的核心。时间线不是”将来某天”,而是”已经开始了”。
行业数据在说什么
个人体验之外,数据同样惊人。
半导体研究机构 SemiAnalysis 在最近发布的 Claude Code is the Inflection Point 报告中给了几个数字:Claude Code 目前已经贡献了 GitHub 公开 commit 的 4%。按当前趋势,2026 年底将达到 20% 以上。也就是说,到今年年底,GitHub 上每五次代码提交就有一次来自 Claude Code。
独立研究机构 METR 的跟踪数据显示,AI 能自主完成的任务时长(以人类专家耗时为基准)大约每 4-7 个月翻一倍,而且在加速。一年前 AI 能自主处理的任务大概需要人类 10 分钟完成。现在这个数字已经接近 5 小时。
Node.js 创始人 Ryan Dahl 说得更直接:”人类写代码的时代结束了。” Ruby on Rails 创始人 DHH 则带着一种夕阳产业的感伤写道,手写代码开始有了一种”奢侈感”。连 Linux 之父 Linus Torvalds 都在 vibe coding 了。
SemiAnalysis 报告中有一个判断我觉得特别关键:编程只是 AI 的滩头阵地(beachhead),不是终点。所有信息工作都遵循同一个模式——读取信息、应用知识、产出结果、验证标准。AI 在编程领域证明了它能跑通这个循环,下一步就是法律、金融、咨询、医疗。全球 15 万亿美元的信息工作市场、超过 10 亿信息工作者,都在射程之内。
华尔街在用真金白银投票
不只是行业内部的人在兴奋。资本市场正在同时做两件事:疯狂押注 AI 赢家,疯狂抛售 AI 输家。
押注的一面:Alphabet 24 小时内发债募资近 320 亿美元,其中 100 年期英镑债获得近 10 倍超额认购。Anthropic 接近完成超 200 亿美元融资,投资者包括黑石、贝莱德和英伟达。中国的 AI 企业家也在乘着这波浪潮上市,MiniMax 创始人闫俊杰等人成为新一批亿万富翁。
抛售的一面:两天内全球软件和法律服务公司市值蒸发 2850 亿美元,投资人给这次抛售起了个名字——“SaaSpocalypse”(软件末日)。导火索是 Anthropic 发布了一套帮企业法务部门自动审合同的 AI 工具。之后恐慌继续蔓延:初创公司 Altruist 推出 AI 税务工具,嘉信理财等财富管理公司股价受挫;保险经纪、房地产服务、医药研发外包也未能幸免。连微软都在一周内被两次下调评级,原因是其软件产品可能遭到 AI 的直接挑战。华尔街的策略正在从”寻找 AI 赢家”转向”躲避 AI 输家”。
这次抛售的核心逻辑我在上一篇文章里分析过:AI 不再是每月 20 美元的效率工具。当 AI 能独立完成复杂的专业任务,公司的采购逻辑就变了——比较的对象不再是”这个软件值不值 20 美元”,而是”这个 AI 能不能顶半个员工”。花钱的口袋从 IT 预算变成了工资预算。
那它为什么还搞不清 50 米该不该走路?
原因不复杂。
当前大语言模型的底层机制是模式匹配和统计概率。它通过海量文本学会了”什么词大概率跟在什么词后面”,这让它在语言相关的任务上极强,但在需要常识推理、物理直觉的问题上容易翻车。
50 米该走路还是开车,对人来说不需要思考。但对 AI 来说,这需要串联多层隐含信息:”50 米很近”、”洗车要把车开过去”、”但问的是’我’怎么去”。这不是它在训练数据里被反复强化的模式。
有个框架可以帮助理解这种不对称:验证者法则(Verifier’s Law)。AI 在”验证容易”的领域特别强——代码可以跑测试、合同条款有明确标准、财务模型可以回验。但在”验证难”的领域就会露馅——常识判断没有标准答案,生活经验没有测试用例。
SemiAnalysis 从技术角度也提到了类似问题:AI 在长任务中每一步决策都有微小误差,这些误差会累积放大。所以 token 效率(每步决策的信噪比)决定了 AI 能自主工作多远才会”跑偏”。
这就是锯齿的来源。强的地方,强到让华尔街蒸发 2850 亿市值。弱的地方,弱到让你觉得它像个没出过门的小孩。
锯齿在缩小
不要因为洗车段子低估 AI。也不要因为 Matt Shumer 的帖子无条件信任它。
关键是知道锯齿在哪里。什么任务可以放心委托,什么任务必须自己把关。这和我在分析 SaaSpocalypse 时的结论一致:未来真正值钱的能力,是能精准地告诉 AI 该做什么、并判断它做得对不对的专业积累。纯执行性工作正在被替代,但”知道该执行什么”以及”知道执行得对不对”——这两样,暂时还得靠人。
还有一件事:锯齿在缩小。去年 AI 做不好的事,今年可能已经做得不错了。Matt Shumer 提到一个经验法则——如果一个模型今天展现出某种能力的苗头,下一代就会在这件事上真正变强。这个进步不是线性的,是指数级的。
洗车段子很好笑。但笑完之后值得想一下:这把锯齿刀的尖峰已经够到了华尔街和硅谷,下一个够到的会是哪里?
相关阅读:
原文发布于 richchat.cc
Matt Shumer 原帖:Something Big Is Happening
SemiAnalysis 报告:Claude Code is the Inflection Point