医生用AI是庸医,程序员用AI是大神——同样是用AI,为什么大家对他们的态度天差地别?

医生用AI是庸医,程序员用AI是大神——同样是用AI,为什么大家对他们的态度天差地别?

sjmyuan 0 2026-07-01

一个让我困惑的短视频

前几天刷到一个短视频:病人在门诊看病,有人拍到医生全程偷偷用手机上的AI软件辅助诊断。视频下的很多评论都觉得医生水平不行、不负责任。

说实话,我的第一反应和评论区一样。但仔细一想又觉得不对劲——我们不是天天在Vibe Coding么?怎么换了医生用,大家的态度就这么差?

这套"双标"让我越想越好奇:为什么同样是AI辅助工作,程序员用就是先进、高大上,医生用就是不专业、不值得信任?

我一开始想到的解释是错误容忍度——医疗行业出错可能是一条人命,病人当然希望医生慎之又慎。而软件行业呢?bug 有自动化测试兜底,线上故障有回滚机制,公司更看重速度——程序员越快越好,出错反而是次要的。

这个解释貌似合理,但无法解释下面的两个例子。

智能驾驶和智能电话推销

第一个例子是智能驾驶。

你肯定看过那种新闻——车主开启智能驾驶后放松警惕,车辆径直撞上护栏或停在路边的故障车,车毁人亡。过去几年仅公开报道的严重事故就有十几起,每一起都是车主过度信任系统、系统没能识别边缘场景。这比医生误诊的风险还高。

但结果呢?很多人还是愿意用。 哪怕出了这么多事故,特斯拉的FSD、蔚来的NOP+等各家辅助驾驶系统照样有一大堆用户开得不亦乐乎,路上随处可见亮着小蓝灯的辅助驾驶车辆,一点没被那些新闻吓退。如果"出错代价高"就意味着AI接受度低,那智能驾驶应该被骂得最狠才对——但它没有。

第二个例子是智能电话推销。

这大概是每个人都经历过的——接听一个陌生电话,听了几句发现对面是AI,直接立刻挂断。甚至有时候聊了好几句才发现对面是AI,那一瞬间会有种被冒犯的感觉。

但智能电话推销出错的代价高吗?不高——顶多浪费几分钟、购买了一个没用的产品而已。比起医生误诊和智能驾驶出车祸,它的错误代价几乎可以忽略不计。

可我们偏偏对它容忍度最低。

这就矛盾了:高风险=接受(智能驾驶),低风险=拒绝(智能电话推销)。 错误容忍度这个框架,根本解释不了。

一个新的框架:标准化判断 vs 人性化判断

那真正在起作用的维度是什么?把四个场景放在一起重新看:

场景

错误后果

用户态度

AI在做什么

医生用AI诊断

可能致命

❌ 反感

分析病人的具体情况

程序员用AI编码

线上故障

✅ 接受

生成标准化代码

智能驾驶

可能致命

✅ 接受

遵守交通规则

智能电话推销

浪费时间

❌ 挂断

推销符合你个性化需求的产品

关键区别不在于"错了会怎样",而在于AI在这里做的是"标准化判断"还是"人性化判断"

标准化判断:有标准答案的事。智能驾驶就是典型——交通规则写在纸面上,红灯停绿灯行,所有人都一样。AI遵守规则,你没什么好不放心的。

人性化判断:没有标准答案、因人而异的事。医生给你看病,不是给"统计人群"看病——你要他看的是你独有的症状组合、生活习惯、过敏史,不是论文里的平均数据。智能电话推销也是——你接听电话是因为你的需求、你的喜好、你的情况,不是"大部分用户"的情况。

这正是 120+ Jobs That AI Can't Replace Across 13 Fields in 2026 在讲的核心洞察:

"The output produced by an AI tool is always predictive, based on algorithms and what the tool has been exposed to so far."

AI永远在输出训练数据的统计平均值。智能驾驶这种"平均值就是最优解"的场景,AI完美胜任。医生诊断、电话推销这种你需要的不只是一个平均值的场景,AI越帮忙,你越觉得它帮倒忙。

但还有一个更深的层次——

你反感医生用AI,不是因为AI准确率不够高(事实上在某些诊断任务上AI准确率已超过人类)。你反感是因为:"你没在给我看病,你在给我所在的统计人群看病。" 你从医生那里想要的不仅是"正确答案",还有"我得到了个性化的关注"——这个感受本身就是诊疗的一部分。

智能电话推销也一样。我不是不能接受AI说"这个产品很适合你",我是不能接受你连问都不问我具体情况就给我一个模板回答。

那智能驾驶为什么不被排斥?因为司机要的本来就不是个性化服务——规则是统一的,你遵守好就行。你不需要它"懂你",你只需要它遵守规则。

这就引出了问题的核心:AI的天花板不在能力边界,而在人性化判断的边界。

说了也没用:人性化判断的四个层次

前面论证了AI只能做标准化判断、做不了人性化判断。但人性化判断本身也有层次。有些可以教给AI,有些不行,有些不划算教。而不行和不划算的那部分,才是你真正的护城河

第一层:我能说清楚,AI能学会

比如"我喜欢用函数式风格写代码"、"测试覆盖率要达到90%以上"、"优先选择社区活跃的库"。这些偏好和规则是明确的,写成 Prompt 喂给 AI,它就能照做。

第二层:我能说清楚,但不想告诉AI

比如"选A方案是因为团队里资历最深的同事更擅长A的技术栈"、"不选B是因为上次用B的失败项目让管理层对这条路有偏见"。这些因素直接影响决策,但你不适合写进 Prompt——它们太敏感、太政治、太容易引起争议。AI如果知道了这些,它要么无法恰当处理,要么在团队里说出来反而坏事。

第三层:我能说清楚,但不划算告诉AI

比如一次较大的代码重构——涉及几十个文件,修改点零碎分散,每个文件要改的模式又不完全一样。你没法用一两句话说清楚"要改什么",必须逐个代码块分析上下文才能决定怎么改。这种情况下,把每个细节都描述给AI的功夫,自己早就改完了。告诉AI没有性价比。

第四层:我说不清楚,AI更学不会

这一层才是最关键的。

你有没有过这种体验?两个架构方案摆在面前,旗鼓相当,从数据上看选哪个都行。但你就是觉得应该选A。同事问你为什么,你想了半天也只能说"感觉"。

不是你在敷衍——那个判断来自你过去做过的类似决策、踩过的坑、对这个团队技术脾性的直觉。这些东西没有写在任何文档里,你也很难用语言完整表达。

但这里有一个更深的问题:即使你说清楚了,有些决策的本质也不是"求解",而是"对齐"。

AI 能分析所有方案,但决定不了哪个更好——求解模式与对齐模式的对比

图:求解模式中 AI 可独立完成全流程,对齐模式中 AI 只能停在"团队讨论"之前——因为讨论的本质不是找答案,而是达成共识。

当"讨论"是决策本身

前阵子我们就遇到一个架构问题:一笔业务数据到底该存在哪个系统?有人说A系统,有人说B系统,各有各的技术理由,扯了半天谁也说服不了谁。

AI能帮上什么忙?它可以列出放A系统的好处(查询快、运维成熟)、放B系统的好处(数据一致性好、扩展方便)。两边优缺点列得清清楚楚,但决定就是做不出来。

为什么?因为技术上的优缺点在这里起不了决定作用。真正起决定作用的问题是:谁来维护这些数据?哪个系统更方便这个人操作?

这是数据所有权和管理权的问题。A系统的维护团队最熟悉这些数据的业务场景,把数据塞进他们不熟悉的B系统,出问题他们连排查入口都找不到。这个考量,AI完全使不上劲——它不知道两个团队各自的能力边界在哪,不知道上次A系统的维护团队被B系统坑过的事故,更不知道维护者们嘴上不说、但心里清楚的,"这个活儿落在谁头上"才是关键。

所以AI能做的,只是分析技术上的优缺点——这是标准化判断的范畴,AI做得很好。但它没法替你回答:谁对结果负责?谁更方便维护?谁的话语权更大?

因为讨论的本质不是在数据中找答案——如果答案在数据里,大家自己看数据就行,不需要讨论。讨论是在信息不完整、各方利益不一致、团队有自己的历史包袱和偏好时,通过碰撞达成共识的过程。

方案的选择通常被这些因素左右:

  • 团队已有的技术实践("我们一直在用Spring,换Quarkus有学习成本")

  • 个人技术偏好("我觉得Haskell写起来就是爽,你有意见吗")

  • 战略方向("技术VP说今年要把Go作为主力语言")

  • 历史包袱("上次选了个冷门框架,半年后没人维护,大家都在骂")

  • 团队氛围("这个团队习惯深度讨论,不是谁说了算")

这些因素的共同点是:我无法全部告诉AI。 其中一部分我说不清,一部分我不愿说,一部分说出来也没用——因为决策权本来就不在我一个人手里,最终结论来自一群人的交流。

这个过程——讨论、让步、对齐、达成共识——和AI的能力边界无关。即使AGI明天就出现,你仍然需要和同事面对面讨论出一个大家都能接受的方案。因为技术决策的最终目标往往不是"正确答案",而是"大家愿意往前走的方向"。

这就是程序员的护城河所在。

程序员的护城河不在"做得更快"

过去很长一段时间,程序员的核心价值是"能用代码解决问题"。写得越快越稳,价值越高。AI正在系统性地削弱这个价值——写代码这件事越来越接近标准化判断。GitHub Copilot、Claude、Cursor这些工具,正在把"需求翻译成代码"的效率提升一个量级。

但与此同时,AI正在放大另一端——需要参与判断的工作——的价值。

AI能帮你做的分析越多、越快,你需要做的判断就越重要。当一个架构方案的优缺点五分钟内就被AI梳理得清清楚楚,真正的瓶颈就变成了:谁来做决定?谁能推动团队对齐?谁能看到数据之外的因素?

这些问题,AI一个都回答不了。

所以与其说"找AI替代不了的岗位",不如说程序员需要完成一次工作方式的转变:从"完成指令"到"参与判断"。

具体来说:

  • 参与技术方案的讨论环节,而不是等着拿到方案后执行

  • 主动推动团队对齐,理解每个人的偏好和顾虑,找到折中点

  • 积累无法写在文档中的隐性知识——对团队的了解、对业务的理解、对技术方向的直觉

  • 成为那个"最后做决定"的人,而不是那个"AI做了决定我照着写代码"的人

10 Jobs AI Won't Replace: Future-Proof Careers for the AI Era 把AI不可替代的工作归纳为"四大支柱"——高人际密度、复杂环境中的现场办公、开放式问题解决、道德法律责任。但拆开看,这四大支柱本质上都在说同一件事:这些工作需要人性化判断,而你无法把人性化判断外包给一个输出统计平均值的系统。

文章里还有一句话说得更直接:"AI can remix patterns, but it cannot set cultural direction." 文章以创意总监为例阐述这个观点,但在软件行业也一样。AI可以帮你生成代码模式、分析架构选项、整理技术风险,但它永远无法参与"这个团队应该往哪个方向走"的对话。那是只有你——在这个团队里、了解这些人的历史、知道这些上下文的人——才能做的事。

结语

回到开头那个短视频。病人反感医生用AI,不是因为AI不够准,而是因为病人想要的不是一个平均水平的诊断,而是一个针对他自己的判断

我们做程序员也一样。AI会写更多代码、分析更多方案、提出更多建议——但最终,那些需要和你一起讨论、需要你参与共识、需要你把说不清的东西带到对话里的判断,才是你真正不可替代的部分。

你的护城河不是那些AI做不到的事,而是那些AI无法参与的对话。

那些对话既需要你的隐性知识,也需要你人在现场。AI在左边,你在右边。它在搞定"该怎么做",你在回答"我们该往哪走"。

后者,才是真正产生价值的地方。