从全栈开发者到 AI 产品构建者：真正改变了什么

没有人告诉你的那段转型期

两年前，我是一个知道怎么调用 OpenAI API 的全栈开发者。今天，我大部分时间都在设计 Agentic 系统、思考检索质量、调试概率性行为。

技术技能大部分迁移过来了。心智模型大部分没有。

传统软件是确定性的。相同输入，相同输出。你可以写单测，复现 Bug，精确推理行为。

AI 系统是概率性的。相同输入可能产生不同输出。"测试"意味着构建评估集和度量分布，而不是断言相等。"调试"意味着理解失败的模式，而不是追踪执行路径。

这种转变会打破很多你原本没意识到自己持有的假设。

在传统软件中，你构建功能。在 AI 产品中，你释放能力——然后把大部分时间花在约束这些能力上。

模型几乎什么都能做。你的工作是定义它在你的具体场景下应该可靠地做哪件事。这很反直觉：你拥有一个极其强大的通用系统，你的价值主张是让它更加受限。

传统软件要么正常，要么不正常。AI 输出存在质量谱系。"足够好"是合理的标准，而知道标准该设在哪里是产品判断，不是技术判断。

90% 的准确率什么时候可以接受？什么时候需要 99%？这取决于用户体验、错误代价，以及是否有人工在回路中。这些不是工程问题——是产品问题。

清晰写作。 你的提示词是规格说明。模糊的规格说明产生模糊的输出。你写精确、无歧义指令的能力越强，你的系统行为就越好。

评估设计。 构建好的测试集——能测试用户行为真实分布的输入——是核心技能。大多数团队跳过这步，然后为此付出代价。

用户研究。 AI 系统常常在需求层面失败：你构建了错误的东西，或者衡量了错误的指标。在 AI 领域，构建前后都和用户深入交流比以往更重要，因为失败模式更加隐蔽。

产品感觉。 当 AI 出错时，是大问题还是小麻烦？系统应该大声失败还是优雅降级？这些需要很强的产品判断力。

系统思维。 设计智能体管道从根本上就是设计系统：组件、接口、数据流、失败模式。好的软件架构直觉可以直接迁移。

调试纪律。 当 AI 系统神秘地失败时，工程学的方法——隔离变量、形成假说、系统性验证——完全正确。

API 设计直觉。 你的提示词就是 API。同样的原则适用：清晰的契约、处理边界情况、谨慎地版本化。

在 AI 领域成功的开发者，停止问"我怎么让这个能用？"，开始问"我怎么让这个值得信赖？"

值得信赖意味着：可预测的失败模式、良好的不确定性沟通、可审计性，以及优雅的降级。这些特性比原始能力更难构建，也正是区分 Demo 和产品的关键所在。

这项技术确实令人兴奋。但真正困难、真正重要的工作，是让它可靠到足以让人真正依赖。