朴谷分享 | 从Demo到生产:Claude Agent落地指南,关键在组织而非模型
PG Advisory
Research Team

最近几年每到年底复盘,很多企业都有相同感受:模型越来越强、预算也花了,可业务还是老样子。问答、头脑风暴都行,一旦把一段完整的任务交给AI,常常干到一半就卡壳:要么找不到数据,要么没权限开文件,要么流程走到某一步断掉,最后没人敢拍板“这活算干完”。
差在哪?不在模型,而在企业没有准备好“能交给 AI 的活”。
Anthropic CPO Mike Krieger 上周接受采访时,没有夸 Claude 多强,而是抛了一个更现实的问题:AI 到底能不能真正分担你的部分工作?答案,取决于企业自己。Anthropic 在企业部署中的体会是:真正的障碍不在技术,而在组织本身。
(说明:我们最近连续写了三篇Agent 文章,但关注点不同:Notion 写“Agent 怎么进流程”,Hinton 写“Agent 出公司后规则怎么变”,Krieger 写“企业想让 AI 真干活,卡在 demo 到生产这道坎”。三篇不是重复,是同一条线的三段推进。)
第一节|AI 不止写代码:它在试着干活
当下几乎所有 AI 公司都在从“模型多聪明”转向“能否真正干活”。Anthropic 的路径很典型:他们没有把 Claude 当更聪明的聊天机器人,而是当能接活的同事来设计。
- 起点是Claude Code:最初它只是开发工具,能补全代码、搭网页、生成 demo。这个工具发布半年,年化营收就破了 10 亿美元,客户包括 Netflix、毕马威、Spotify、欧莱雅。
- 内部用法的变化:Anthropic 内部很多团队不是用它“写完一段代码”,而是让它接手整段工作流。例如把它当“盒子里的 SRE”监控系统与自动排查日志;当生物研究助手搜文献、搭数据处理脚本;甚至担任项目经理汇总需求、下发子任务。
- 能力定位的升级:2025 年底,Anthropic 把 Claude Code 改名为 Claude Agent SDK,角色从“生成答案”升级为“执行流程、交付结果”的“角色单位”。
要交付结果,就必须让AI 能持续工作、稳定执行。因此,Anthropic 开始为“自动完成”构建支撑机制:不是给段输入看段输出,而是在更模糊的目标下,让 AI 持续推进直至提交成果。能力到位了,新的“坎”也浮现:不是 AI 不行,而是组织还没准备好。
第二节|真正的落地坎,不在模型,在组织
很多企业以为把AI 接进来,就像请了个聪明实习生:开账号、发指令,它就能自己上手。结果常见的“慢、模糊、卡壳”,根因在企业侧——任务没派清,信息也没备好。
- 数据不可读:让AI 查报表、分析客户数据,它去哪里找?许多公司连自己的人都不清楚数据放在哪;表格列名“Sheet3_Temp”无注释无上下文,AI 面对一堆碎片无从下手。要让 AI 理解业务数据,必须有清晰的标签、注释、血缘关系与口径说明。
- 权限不通:AI 再能干,没有访问入口也寸步难行。常见情况是流程要跳十几个系统、文件层层审批、关键环节无统一入口。
- 流程未定义:组织没有想清楚三件事——让 AI 做什么?需要什么信息?做完给谁?在这种前置条件缺失的情况下,AI 很难进入主流程。
换句话说,第一层工作是把“数据、权限、系统”准备好,起码让 AI 有路可走、有数可读、有账可交。
第三节|从“问答”到“派活”,思路要变
就算数据与权限到位,企业仍需跨过第二层门槛:学会“派活”。AI 不是搜索引擎,更不是点一下就能用的插件;它更像刚入职的新人——要说明职责、交付物与合格标准,它才能上手。
- 有效的派活方式,类似对待实习生:
- 明确角色与边界:告诉它“你是财务助理”,只负责统计客户收入与退款差额。
- 提供入口与权限:给出表格位置与只读/读写权限。
- 规定输出格式:按Q4 月度模板产出表格草稿。
- 定义验收标准:口径一致、字段完整、误差范围与异常处理。
GitHub 与 Anthropic 合作的 PR Agent,就是按这个逻辑设计:在代码审查页面标记 Claude,它会自动审查代码、总结修改、给出建议并完成一轮修改;你无需全程盯着,回来即可查看结果。它之所以能用起来,是因为:
- 任务清晰:每次只做“审查→总结→建议→修改”这几步;
- 权限到位:能读库、能写修改、能提交结果;
- 流程稳定:路径固定、接口明确、产出可验收。
真正落地还需要“能追责”。网上常有人说“AI 不能背锅”。问题不在 AI 会不会背,而在企业敢不敢让它“可追溯”。在 PR Agent 的场景中,Claude 的修改有记录、有审查、有版本管理;出了问题能定位到哪一步。这就是“可追责”的组织条件。要点不是技术多强,而是组织愿不愿意给 AI 明确的责任边界与审计轨迹。
结语|组织准备好,AI 才能用起来
Mike Krieger 的观察很朴素:不是 AI 不行,是组织没准备好。进入 2026 年,企业可以用四个问题自检:
- 数据理清楚了吗(标签、口径、血缘、注释是否完备)?
- 权限放得开吗(最小必要权限、可审计、可回退)?
- 任务说得明白吗(角色、边界、输出与验收标准)?
- 责任划得清吗(人机分工、流程所有权、出错可追溯)?
这四件事到位,AI 才能从“会干活”走向“真干活”。瓶颈不在技术,而在组织。跨过这道坎,AI 的生产力才会在 2026 年真正被释放。
朴谷观点
- 以场景为锚启动,而非“工具先行”:优先选择可量化、可闭环、可定义验收标准的流程作为试点(如 PR 审查、数据月度对账、客户问答分流),快速建立可验证的成功样本。
- 先定“流程所有权”,再定“模型策略”:明确谁对流程负责,哪些环节由 Agent 执行、哪些节点必须人工把关、失败的回退路径是什么;将传统 RACI 扩展为 RACI+A(Agent)。
- 把SOP 改造成“可被 AI 接入”的流程资产:入口结构化(表单/接口)、过程可追踪(日志/事件流)、结果可验收(模板/KPI/签收);从 SOP→API→Agent 的三段式演进,少走“上线即全自动”的极端。
- 权限与数据治理前置:采用最小必要权限、可回放日志、异常熔断与人工接管机制;为关键数据建立统一口径、标签与血缘,减少“Sheet3_Temp”式黑箱。
- 重新定义岗位与绩效:在岗位说明中写清“与 AI 协作”的职责(任务拆解、提示设计、质量验收、回退处理);绩效从“人工产出量”转向“单位成果的成本/周期/质量”,避免逆向激励。
- 能力模型升级:将提示工程、任务编排、验收标准制定与变更管理纳入必修;培养能“把流程交给 AI 并守住质量”的一线骨干。
- 用“小闭环”撬动“大规模”:先在一个域内跑通“端到端真交付”的闭环,再横向复制到相邻流程,形成标准、工具与知识的可复用资产。
结论:AI 的成败手,在组织。谁先把“数据—权限—流程—责任”四道关打通,谁就能把“一个人 + 一个 Agent”的潜力转化为稳定、可衡量、可复制的生产力。
Disclaimer: The information provided in this article is for general informational purposes only and does not constitute financial advice.
