没有人告诉你的那段转型期
两年前,我是一个知道怎么调用 OpenAI API 的全栈开发者。今天,我大部分时间都在设计 Agentic 系统、思考检索质量、调试概率性行为。
技术技能大部分迁移过来了。心智模型大部分没有。
真正不同的是什么
确定性 → 概率性
传统软件是确定性的。相同输入,相同输出。你可以写单测,复现 Bug,精确推理行为。
AI 系统是概率性的。相同输入可能产生不同输出。"测试"意味着构建评估集和度量分布,而不是断言相等。"调试"意味着理解失败的模式,而不是追踪执行路径。
这种转变会打破很多你原本没意识到自己持有的假设。
功能 → 能力 + 约束
在传统软件中,你构建功能。在 AI 产品中,你释放能力——然后把大部分时间花在约束这些能力上。
模型几乎什么都能做。你的工作是定义它在你的具体场景下应该可靠地做哪件事。这很反直觉:你拥有一个极其强大的通用系统,你的价值主张是让它更加受限。
正确性 → 足够好的质量
传统软件要么正常,要么不正常。AI 输出存在质量谱系。"足够好"是合理的标准,而知道标准该设在哪里是产品判断,不是技术判断。
90% 的准确率什么时候可以接受?什么时候需要 99%?这取决于用户体验、错误代价,以及是否有人工在回路中。这些不是工程问题——是产品问题。
比你预期更重要的技能
清晰写作。 你的提示词是规格说明。模糊的规格说明产生模糊的输出。你写精确、无歧义指令的能力越强,你的系统行为就越好。
评估设计。 构建好的测试集——能测试用户行为真实分布的输入——是核心技能。大多数团队跳过这步,然后为此付出代价。
用户研究。 AI 系统常常在需求层面失败:你构建了错误的东西,或者衡量了错误的指标。在 AI 领域,构建前后都和用户深入交流比以往更重要,因为失败模式更加隐蔽。
产品感觉。 当 AI 出错时,是大问题还是小麻烦?系统应该大声失败还是优雅降级?这些需要很强的产品判断力。
比你预期迁移得更好的技能
系统思维。 设计智能体管道从根本上就是设计系统:组件、接口、数据流、失败模式。好的软件架构直觉可以直接迁移。
调试纪律。 当 AI 系统神秘地失败时,工程学的方法——隔离变量、形成假说、系统性验证——完全正确。
API 设计直觉。 你的提示词就是 API。同样的原则适用:清晰的契约、处理边界情况、谨慎地版本化。
最重要的思维方式
在 AI 领域成功的开发者,停止问"我怎么让这个能用?",开始问"我怎么让这个值得信赖?"
值得信赖意味着:可预测的失败模式、良好的不确定性沟通、可审计性,以及优雅的降级。这些特性比原始能力更难构建,也正是区分 Demo 和产品的关键所在。
这项技术确实令人兴奋。但真正困难、真正重要的工作,是让它可靠到足以让人真正依赖。