PG Advisory - Financial Consulting with Insight & Integrity

最近几年每到年底复盘，很多企业都有相同感受：模型越来越强、预算也花了，可业务还是老样子。问答、头脑风暴都行，一旦把一段完整的任务交给AI，常常干到一半就卡壳：要么找不到数据，要么没权限开文件，要么流程走到某一步断掉，最后没人敢拍板“这活算干完”。

差在哪？不在模型，而在企业没有准备好“能交给 AI 的活”。

Anthropic CPO Mike Krieger 上周接受采访时，没有夸 Claude 多强，而是抛了一个更现实的问题：AI 到底能不能真正分担你的部分工作？答案，取决于企业自己。Anthropic 在企业部署中的体会是：真正的障碍不在技术，而在组织本身。

（说明：我们最近连续写了三篇Agent 文章，但关注点不同：Notion 写“Agent 怎么进流程”，Hinton 写“Agent 出公司后规则怎么变”，Krieger 写“企业想让 AI 真干活，卡在 demo 到生产这道坎”。三篇不是重复，是同一条线的三段推进。）

第一节｜AI 不止写代码：它在试着干活

当下几乎所有 AI 公司都在从“模型多聪明”转向“能否真正干活”。Anthropic 的路径很典型：他们没有把 Claude 当更聪明的聊天机器人，而是当能接活的同事来设计。

起点是Claude Code：最初它只是开发工具，能补全代码、搭网页、生成 demo。这个工具发布半年，年化营收就破了 10 亿美元，客户包括 Netflix、毕马威、Spotify、欧莱雅。

内部用法的变化：Anthropic 内部很多团队不是用它“写完一段代码”，而是让它接手整段工作流。例如把它当“盒子里的 SRE”监控系统与自动排查日志；当生物研究助手搜文献、搭数据处理脚本；甚至担任项目经理汇总需求、下发子任务。

能力定位的升级：2025 年底，Anthropic 把 Claude Code 改名为 Claude Agent SDK，角色从“生成答案”升级为“执行流程、交付结果”的“角色单位”。

要交付结果，就必须让AI 能持续工作、稳定执行。因此，Anthropic 开始为“自动完成”构建支撑机制：不是给段输入看段输出，而是在更模糊的目标下，让 AI 持续推进直至提交成果。能力到位了，新的“坎”也浮现：不是 AI 不行，而是组织还没准备好。

第二节｜真正的落地坎，不在模型，在组织

很多企业以为把AI 接进来，就像请了个聪明实习生：开账号、发指令，它就能自己上手。结果常见的“慢、模糊、卡壳”，根因在企业侧——任务没派清，信息也没备好。

数据不可读：让AI 查报表、分析客户数据，它去哪里找？许多公司连自己的人都不清楚数据放在哪；表格列名“Sheet3_Temp”无注释无上下文，AI 面对一堆碎片无从下手。要让 AI 理解业务数据，必须有清晰的标签、注释、血缘关系与口径说明。

权限不通：AI 再能干，没有访问入口也寸步难行。常见情况是流程要跳十几个系统、文件层层审批、关键环节无统一入口。

流程未定义：组织没有想清楚三件事——让 AI 做什么？需要什么信息？做完给谁？在这种前置条件缺失的情况下，AI 很难进入主流程。

换句话说，第一层工作是把“数据、权限、系统”准备好，起码让 AI 有路可走、有数可读、有账可交。

第三节｜从“问答”到“派活”，思路要变

就算数据与权限到位，企业仍需跨过第二层门槛：学会“派活”。AI 不是搜索引擎，更不是点一下就能用的插件；它更像刚入职的新人——要说明职责、交付物与合格标准，它才能上手。

有效的派活方式，类似对待实习生：

明确角色与边界：告诉它“你是财务助理”，只负责统计客户收入与退款差额。

提供入口与权限：给出表格位置与只读/读写权限。

规定输出格式：按Q4 月度模板产出表格草稿。

定义验收标准：口径一致、字段完整、误差范围与异常处理。

GitHub 与 Anthropic 合作的 PR Agent，就是按这个逻辑设计：在代码审查页面标记 Claude，它会自动审查代码、总结修改、给出建议并完成一轮修改；你无需全程盯着，回来即可查看结果。它之所以能用起来，是因为：

任务清晰：每次只做“审查→总结→建议→修改”这几步；

权限到位：能读库、能写修改、能提交结果；

流程稳定：路径固定、接口明确、产出可验收。

真正落地还需要“能追责”。网上常有人说“AI 不能背锅”。问题不在 AI 会不会背，而在企业敢不敢让它“可追溯”。在 PR Agent 的场景中，Claude 的修改有记录、有审查、有版本管理；出了问题能定位到哪一步。这就是“可追责”的组织条件。要点不是技术多强，而是组织愿不愿意给 AI 明确的责任边界与审计轨迹。

结语｜组织准备好，AI 才能用起来

Mike Krieger 的观察很朴素：不是 AI 不行，是组织没准备好。进入 2026 年，企业可以用四个问题自检：

数据理清楚了吗（标签、口径、血缘、注释是否完备）？

权限放得开吗（最小必要权限、可审计、可回退）？

任务说得明白吗（角色、边界、输出与验收标准）？

责任划得清吗（人机分工、流程所有权、出错可追溯）？

这四件事到位，AI 才能从“会干活”走向“真干活”。瓶颈不在技术，而在组织。跨过这道坎，AI 的生产力才会在 2026 年真正被释放。

朴谷观点

以场景为锚启动，而非“工具先行”：优先选择可量化、可闭环、可定义验收标准的流程作为试点（如 PR 审查、数据月度对账、客户问答分流），快速建立可验证的成功样本。

先定“流程所有权”，再定“模型策略”：明确谁对流程负责，哪些环节由 Agent 执行、哪些节点必须人工把关、失败的回退路径是什么；将传统 RACI 扩展为 RACI+A（Agent）。

把SOP 改造成“可被 AI 接入”的流程资产：入口结构化（表单/接口）、过程可追踪（日志/事件流）、结果可验收（模板/KPI/签收）；从 SOP→API→Agent 的三段式演进，少走“上线即全自动”的极端。

权限与数据治理前置：采用最小必要权限、可回放日志、异常熔断与人工接管机制；为关键数据建立统一口径、标签与血缘，减少“Sheet3_Temp”式黑箱。

重新定义岗位与绩效：在岗位说明中写清“与 AI 协作”的职责（任务拆解、提示设计、质量验收、回退处理）；绩效从“人工产出量”转向“单位成果的成本/周期/质量”，避免逆向激励。

能力模型升级：将提示工程、任务编排、验收标准制定与变更管理纳入必修；培养能“把流程交给 AI 并守住质量”的一线骨干。

用“小闭环”撬动“大规模”：先在一个域内跑通“端到端真交付”的闭环，再横向复制到相邻流程，形成标准、工具与知识的可复用资产。

结论：AI 的成败手，在组织。谁先把“数据—权限—流程—责任”四道关打通，谁就能把“一个人 + 一个 Agent”的潜力转化为稳定、可衡量、可复制的生产力。

Disclaimer: The information provided in this article is for general informational purposes only and does not constitute financial advice.

朴谷分享 | 从Demo到生产：Claude Agent落地指南，关键在组织而非模型