使用 Argo Workflows 编排 AI Agent 自动开发与 Review 工作流#

摘要#

这篇文章整理一个问题：能不能用 Argo Workflows 来做 AI Agent 自动化开发流水线，例如自动接收需求、拉代码、让 Agent 修改代码、运行测试、安全扫描、创建 Pull Request，再进入 Review？

结论先说：

可以做，而且 Argo Workflows 很适合作为这条链路的“编排层”。 但它不是 AI Agent 框架，也不是代码托管平台。比较合理的定位是：

Argo Events：接收外部事件，例如 GitHub Issue、PR comment、Webhook、消息队列事件；
Argo Workflows：按 DAG/步骤编排每个自动化阶段，并管理状态、重试、日志、产物；
AI Agent Runner：真正执行需求理解、代码修改、测试修复、Review 总结的容器或服务；
GitHub/GitLab：承载 Issue、Branch、Commit、Pull Request、Code Review；
Artifact Repository：保存需求快照、Agent 日志、测试报告、Patch、Review 报告；
人工审批点：通过 Argo suspend、代码平台 PR Review、ChatOps 或内部审批系统接住。

如果你已经在 Kubernetes 上运行 CI、批处理、数据任务或平台自动化，那么用 Argo 来编排 AI Agent 工作流是顺手的。它最大的价值不是“让 Agent 更聪明”，而是让 Agent 的每一步可观测、可重试、可审计、可暂停。

本文会从能力判断、推荐架构、落地步骤和完整 YAML 示例四个部分展开。

1. Argo Workflows 能不能满足这个需求#

1.1 适合的部分#

Argo Workflows 官方定位是 Kubernetes 上的容器原生工作流引擎，用来编排并行作业。它的核心资源是 Workflow，工作流定义在 spec 中，执行状态也保存在同一个对象上。一个 Workflow 由多个 template 组成，entrypoint 指定入口模板。

这正好适合 AI Agent 自动开发链路中的这些动作：

需求	Argo 能力	适配方式
接收需求事件	Argo Events `EventSource` + `Sensor`	从 Webhook/GitHub/消息队列触发 Workflow
多阶段执行	`steps` 或 `dag`	需求解析、规划、编码、测试、Review 分阶段跑
并行任务	DAG 依赖	单测、lint、安全扫描、文档检查并行执行
保存中间产物	`artifacts`	保存需求 JSON、patch、测试报告、Agent 日志
参数传递	`parameters`	repo、branch、issue id、模型名、任务描述
人工确认	`suspend` template	在创建 PR 前或合并前暂停等待人工恢复
通知收尾	`onExit` exit handler	成功/失败都通知 Slack、飞书、GitHub comment
定时巡检	`CronWorkflow`	定时扫描待处理需求或重跑失败任务
操作 Kubernetes 资源	`resource` template	动态创建 Job、临时环境、沙箱 Runner
复用流程定义	`WorkflowTemplate`	把 AI 开发流程模板化，事件只传参数

Argo 文档里明确说明，DAG 可以通过依赖关系表达任务图，并让可并行的任务最大化并发执行；WorkflowTemplate 可以把模板保存在集群里并被其他 Workflow 引用；suspend 可以让工作流暂停，之后从 CLI、API 或 UI 恢复；onExit 可以在成功或失败后统一执行通知/清理逻辑。

1.2 不适合单独承担的部分#

Argo 本身不解决这些问题：

不会理解需求
需求解析、代码生成、修复测试、Review 判断，要由你的 Agent 程序完成。
不是 Git 平台
分支、commit、PR、review comment、merge policy 仍然应该交给 GitHub/GitLab/Gitea。
不是权限边界本身
Argo 能用 Kubernetes ServiceAccount/RBAC 隔离权限，但 Agent 访问仓库、模型、云资源的权限仍要单独设计。
不天然防止 Agent 乱改代码
需要配合沙箱、最小权限 token、只允许创建 PR、强制测试、人工审批、分支保护等机制。

所以推荐的判断是：

Argo Workflows 适合做 AI Agent 自动化开发的“流水线控制面”，不适合把它当成完整的 AI 编程平台。

2. 推荐链路设计#

我们设计一个最小但可扩展的案例：

用户在 GitHub Issue 中打上 ai-agent 标签，或通过内部需求系统发起一个 webhook。Argo Events 接收事件后触发 WorkflowTemplate，Workflow 自动完成：

解析需求；
克隆目标仓库；
创建工作分支；
调用 AI Agent 生成修改；
运行 lint 和 test；
生成 Review 报告；
若检查通过，创建 Pull Request；
暂停等待人工 Review；
人工恢复后执行收尾通知。

整体链路如下：

1
GitHub Issue / Webhook
2
        |
3
        v
4
Argo Events EventSource
5
        |
6
        v
7
Argo Events Sensor
8
        |
9
        v
10
WorkflowTemplate: ai-agent-dev-review
11
        |
12
        +--> parse-requirement
13
        +--> clone-repo
14
        +--> agent-plan
15
        +--> agent-code
16
        +--> lint --------+
17
        +--> test --------+--> generate-review-report
18
        +--> security ----+
19
        +--> create-pr
20
        +--> wait-human-review
21
        +--> notify

这里有几个重要设计取舍：

Workflow 只编排，不把 prompt 全塞在 YAML 里：YAML 里只传任务参数，复杂 prompt 和 Agent 逻辑放到镜像内。
Agent 永远在临时分支工作：不要让 Agent 直接 push 到主分支。
PR 是 Review 的主入口：Argo 的 suspend 只是流水线等待点，代码 Review 仍然在 Git 平台完成。
失败也要生成报告：测试失败不代表流程没有价值，Agent 的 patch、日志和失败原因都应该留存。
权限要分层：触发器、Workflow、Agent、Git token、模型 token 分开管理。

3. 安装组件#

截至 2026-04-24，Argo Workflows GitHub release 页面显示最新版本为 v4.0.4。生产环境建议固定版本，不要在安装 YAML 中使用漂移的 latest。

3.1 安装 Argo Workflows#

1
kubectl create namespace argo
2
kubectl apply -n argo -f https://github.com/argoproj/argo-workflows/releases/download/v4.0.4/install.yaml

检查：

1
kubectl get pods -n argo
2
kubectl get crd | grep workflows.argoproj.io

如果只是本地体验，可以先用 quick start 的方式；如果准备给团队用，建议进一步配置：

Argo Server SSO；
Workflow Archive；
Artifact Repository；
Controller HA；
namespace 级别 RBAC；
workflow pod 的默认安全上下文。

3.2 安装 Argo Events#

Argo Events 用来接收外部事件并触发 Workflow。它需要 EventBus、EventSource、Sensor 三类核心资源。

1
kubectl create namespace argo-events
2
kubectl apply -n argo-events -f https://github.com/argoproj/argo-events/releases/download/v1.9.8/install.yaml

创建默认 EventBus：

1
apiVersion: argoproj.io/v1alpha1
2
kind: EventBus
3
metadata:
4
  name: default
5
  namespace: argo-events
6
spec:
7
  nats:
8
    native:
9
      replicas: 3

应用：

1
kubectl apply -f eventbus.yaml

官方文档说明，EventBus 是 namespace 级资源，EventSource 和 Sensor 要正常工作，需要所在 namespace 里有 EventBus。

4. 准备密钥和权限#

4.1 Git Token Secret#

Agent 需要读取仓库、创建分支、push commit、创建 PR。建议使用权限最小化的 GitHub App token 或细粒度 PAT。

1
apiVersion: v1
2
kind: Secret
3
metadata:
4
  name: ai-agent-git-token
5
  namespace: argo
6
type: Opaque
7
stringData:
8
  token: ghp_xxx_replace_me

4.2 模型 API Secret#

1
apiVersion: v1
2
kind: Secret
3
metadata:
4
  name: ai-agent-model-token
5
  namespace: argo
6
type: Opaque
7
stringData:
8
  apiKey: sk-xxx_replace_me

4.3 Workflow 执行 ServiceAccount#

下面给一个最小示例。真实生产里建议按 namespace 和 workflow 类型拆分权限。

1
apiVersion: v1
2
kind: ServiceAccount
3
metadata:
4
  name: ai-agent-workflow
5
  namespace: argo
6
---
7
apiVersion: rbac.authorization.k8s.io/v1
8
kind: Role
9
metadata:
10
  name: ai-agent-workflow
11
  namespace: argo
12
rules:
13
  - apiGroups: ["argoproj.io"]
14
    resources: ["workflows", "workflowtemplates"]
15
    verbs: ["get", "list", "watch", "create", "patch"]
16
  - apiGroups: [""]
17
    resources: ["pods", "pods/log", "secrets", "configmaps"]
18
    verbs: ["get", "list", "watch"]
19
---
20
apiVersion: rbac.authorization.k8s.io/v1
21
kind: RoleBinding
22
metadata:
23
  name: ai-agent-workflow
24
  namespace: argo
25
subjects:
26
  - kind: ServiceAccount
27
    name: ai-agent-workflow
28
    namespace: argo
29
roleRef:
30
  kind: Role
31
  name: ai-agent-workflow
32
  apiGroup: rbac.authorization.k8s.io

5. WorkflowTemplate：AI 自动开发主流程#

下面是核心模板。为了让示例容易理解，假设你已经有一个 Agent 镜像：

1
ghcr.io/example/ai-agent-runner:0.1.0

这个镜像内部提供几个命令：

agent parse-requirement
agent clone
agent plan
agent code
agent lint
agent test
agent security-scan
agent review-report
agent create-pr
agent notify

真实落地时，可以用你自己的 Python/Node/Go 程序实现这些命令。

1
apiVersion: argoproj.io/v1alpha1
2
kind: WorkflowTemplate
3
metadata:
4
  name: ai-agent-dev-review
5
  namespace: argo
6
spec:
7
  serviceAccountName: ai-agent-workflow
8
  entrypoint: main
9
  onExit: exit-notify
10
  arguments:
11
    parameters:
12
      - name: repo_url
13
      - name: base_branch
14
        value: main
15
      - name: requirement_id
16
      - name: requirement_text
17
      - name: requester
18
        value: unknown
19
      - name: model
20
        value: gpt-4.1
21
      - name: dry_run
22
        value: "false"
23

24
  artifactRepositoryRef:
25
    configMap: artifact-repositories
26
    key: default-v1
27

28
  templates:
29
    - name: main
30
      dag:
31
        failFast: false
32
        tasks:
33
          - name: parse-requirement
34
            template: parse-requirement
35

36
          - name: clone-repo
37
            dependencies: [parse-requirement]
38
            template: clone-repo
39
            arguments:
40
              artifacts:
41
                - name: requirement
42
                  from: "{{tasks.parse-requirement.outputs.artifacts.requirement}}"
43

44
          - name: agent-plan
45
            dependencies: [clone-repo]
46
            template: agent-plan
47
            arguments:
48
              artifacts:
49
                - name: workspace
50
                  from: "{{tasks.clone-repo.outputs.artifacts.workspace}}"
51
                - name: requirement
52
                  from: "{{tasks.parse-requirement.outputs.artifacts.requirement}}"
53

54
          - name: agent-code
55
            dependencies: [agent-plan]
56
            template: agent-code
57
            arguments:
58
              artifacts:
59
                - name: workspace
60
                  from: "{{tasks.clone-repo.outputs.artifacts.workspace}}"
61
                - name: plan
62
                  from: "{{tasks.agent-plan.outputs.artifacts.plan}}"
63

64
          - name: lint
65
            dependencies: [agent-code]
66
            template: lint
67
            arguments:
68
              artifacts:
69
                - name: workspace
70
                  from: "{{tasks.agent-code.outputs.artifacts.workspace}}"
71

72
          - name: test
73
            dependencies: [agent-code]
74
            template: test
75
            arguments:
76
              artifacts:
77
                - name: workspace
78
                  from: "{{tasks.agent-code.outputs.artifacts.workspace}}"
79

80
          - name: security-scan
81
            dependencies: [agent-code]
82
            template: security-scan
83
            arguments:
84
              artifacts:
85
                - name: workspace
86
                  from: "{{tasks.agent-code.outputs.artifacts.workspace}}"
87

88
          - name: generate-review-report
89
            dependencies: [lint, test, security-scan]
90
            template: generate-review-report
91
            arguments:
92
              artifacts:
93
                - name: workspace
94
                  from: "{{tasks.agent-code.outputs.artifacts.workspace}}"
95
                - name: lint-report
96
                  from: "{{tasks.lint.outputs.artifacts.lint-report}}"
97
                - name: test-report
98
                  from: "{{tasks.test.outputs.artifacts.test-report}}"
99
                - name: security-report
100
                  from: "{{tasks.security-scan.outputs.artifacts.security-report}}"
101

102
          - name: create-pr
103
            dependencies: [generate-review-report]
104
            template: create-pr
105
            when: "{{workflow.parameters.dry_run}} == false"
106
            arguments:
107
              artifacts:
108
                - name: workspace
109
                  from: "{{tasks.agent-code.outputs.artifacts.workspace}}"
110
                - name: review-report
111
                  from: "{{tasks.generate-review-report.outputs.artifacts.review-report}}"
112

113
          - name: wait-human-review
114
            dependencies: [create-pr]
115
            template: wait-human-review
116

117
          - name: post-review-summary
118
            dependencies: [wait-human-review]
119
            template: post-review-summary
120

121
    - name: parse-requirement
122
      container:
123
        image: ghcr.io/example/ai-agent-runner:0.1.0
124
        command: [sh, -c]
125
        args:
126
          - |
127
            agent parse-requirement \
128
              --id "$REQUIREMENT_ID" \
129
              --text "$REQUIREMENT_TEXT" \
130
              --requester "$REQUESTER" \
131
              --output /tmp/requirement.json
132
        env:
133
          - name: REQUIREMENT_ID
134
            value: "{{workflow.parameters.requirement_id}}"
135
          - name: REQUIREMENT_TEXT
136
            value: "{{workflow.parameters.requirement_text}}"
137
          - name: REQUESTER
138
            value: "{{workflow.parameters.requester}}"
139
      outputs:
140
        artifacts:
141
          - name: requirement
142
            path: /tmp/requirement.json
143

144
    - name: clone-repo
145
      inputs:
146
        artifacts:
147
          - name: requirement
148
            path: /tmp/requirement.json
149
      container:
150
        image: ghcr.io/example/ai-agent-runner:0.1.0
151
        command: [sh, -c]
152
        args:
153
          - |
154
            agent clone \
155
              --repo "$REPO_URL" \
156
              --base-branch "$BASE_BRANCH" \
157
              --work-branch "ai-agent/${REQUIREMENT_ID}" \
158
              --requirement /tmp/requirement.json \
159
              --output /workspace/repo
160
        env:
161
          - name: REPO_URL
162
            value: "{{workflow.parameters.repo_url}}"
163
          - name: BASE_BRANCH
164
            value: "{{workflow.parameters.base_branch}}"
165
          - name: REQUIREMENT_ID
166
            value: "{{workflow.parameters.requirement_id}}"
167
          - name: GIT_TOKEN
168
            valueFrom:
169
              secretKeyRef:
170
                name: ai-agent-git-token
171
                key: token
172
      outputs:
173
        artifacts:
174
          - name: workspace
175
            path: /workspace/repo
176

177
    - name: agent-plan
178
      inputs:
179
        artifacts:
180
          - name: workspace
181
            path: /workspace/repo
182
          - name: requirement
183
            path: /tmp/requirement.json
184
      container:
185
        image: ghcr.io/example/ai-agent-runner:0.1.0
186
        command: [sh, -c]
187
        args:
188
          - |
189
            agent plan \
190
              --repo /workspace/repo \
191
              --requirement /tmp/requirement.json \
192
              --model "$MODEL" \
193
              --output /tmp/plan.md
194
        env:
195
          - name: MODEL
196
            value: "{{workflow.parameters.model}}"
197
          - name: MODEL_API_KEY
198
            valueFrom:
199
              secretKeyRef:
200
                name: ai-agent-model-token
201
                key: apiKey
202
      outputs:
203
        artifacts:
204
          - name: plan
205
            path: /tmp/plan.md
206

207
    - name: agent-code
208
      inputs:
209
        artifacts:
210
          - name: workspace
211
            path: /workspace/repo
212
          - name: plan
213
            path: /tmp/plan.md
214
      container:
215
        image: ghcr.io/example/ai-agent-runner:0.1.0
216
        command: [sh, -c]
217
        args:
218
          - |
219
            agent code \
220
              --repo /workspace/repo \
221
              --plan /tmp/plan.md \
222
              --model "$MODEL" \
223
              --max-files 20 \
224
              --output /workspace/repo
225
        env:
226
          - name: MODEL
227
            value: "{{workflow.parameters.model}}"
228
          - name: MODEL_API_KEY
229
            valueFrom:
230
              secretKeyRef:
231
                name: ai-agent-model-token
232
                key: apiKey
233
      outputs:
234
        artifacts:
235
          - name: workspace
236
            path: /workspace/repo
237

238
    - name: lint
239
      inputs:
240
        artifacts:
241
          - name: workspace
242
            path: /workspace/repo
243
      container:
244
        image: ghcr.io/example/ai-agent-runner:0.1.0
245
        command: [sh, -c]
246
        args:
247
          - |
248
            agent lint \
249
              --repo /workspace/repo \
250
              --output /tmp/lint-report.json
251
      outputs:
252
        artifacts:
253
          - name: lint-report
254
            path: /tmp/lint-report.json
255

256
    - name: test
257
      inputs:
258
        artifacts:
259
          - name: workspace
260
            path: /workspace/repo
261
      container:
262
        image: ghcr.io/example/ai-agent-runner:0.1.0
263
        command: [sh, -c]
264
        args:
265
          - |
266
            agent test \
267
              --repo /workspace/repo \
268
              --output /tmp/test-report.json
269
      outputs:
270
        artifacts:
271
          - name: test-report
272
            path: /tmp/test-report.json
273

274
    - name: security-scan
275
      inputs:
276
        artifacts:
277
          - name: workspace
278
            path: /workspace/repo
279
      container:
280
        image: ghcr.io/example/ai-agent-runner:0.1.0
281
        command: [sh, -c]
282
        args:
283
          - |
284
            agent security-scan \
285
              --repo /workspace/repo \
286
              --output /tmp/security-report.json
287
      outputs:
288
        artifacts:
289
          - name: security-report
290
            path: /tmp/security-report.json
291

292
    - name: generate-review-report
293
      inputs:
294
        artifacts:
295
          - name: workspace
296
            path: /workspace/repo
297
          - name: lint-report
298
            path: /tmp/lint-report.json
299
          - name: test-report
300
            path: /tmp/test-report.json
301
          - name: security-report
302
            path: /tmp/security-report.json
303
      container:
304
        image: ghcr.io/example/ai-agent-runner:0.1.0
305
        command: [sh, -c]
306
        args:
307
          - |
308
            agent review-report \
309
              --repo /workspace/repo \
310
              --lint /tmp/lint-report.json \
311
              --test /tmp/test-report.json \
312
              --security /tmp/security-report.json \
313
              --output /tmp/review-report.md
314
      outputs:
315
        artifacts:
316
          - name: review-report
317
            path: /tmp/review-report.md
318

319
    - name: create-pr
320
      inputs:
321
        artifacts:
322
          - name: workspace
323
            path: /workspace/repo
324
          - name: review-report
325
            path: /tmp/review-report.md
326
      container:
327
        image: ghcr.io/example/ai-agent-runner:0.1.0
328
        command: [sh, -c]
329
        args:
330
          - |
331
            agent create-pr \
332
              --repo /workspace/repo \
333
              --base-branch "$BASE_BRANCH" \
334
              --branch "ai-agent/${REQUIREMENT_ID}" \
335
              --title "AI Agent: ${REQUIREMENT_ID}" \
336
              --body-file /tmp/review-report.md
337
        env:
338
          - name: BASE_BRANCH
339
            value: "{{workflow.parameters.base_branch}}"
340
          - name: REQUIREMENT_ID
341
            value: "{{workflow.parameters.requirement_id}}"
342
          - name: GIT_TOKEN
343
            valueFrom:
344
              secretKeyRef:
345
                name: ai-agent-git-token
346
                key: token
347

348
    - name: wait-human-review
349
      suspend: {}
350

351
    - name: post-review-summary
352
      container:
353
        image: ghcr.io/example/ai-agent-runner:0.1.0
354
        command: [sh, -c]
355
        args:
356
          - |
357
            agent notify \
358
              --status "human-review-finished" \
359
              --requirement-id "$REQUIREMENT_ID"
360
        env:
361
          - name: REQUIREMENT_ID
362
            value: "{{workflow.parameters.requirement_id}}"
363

364
    - name: exit-notify
365
      container:
366
        image: ghcr.io/example/ai-agent-runner:0.1.0
367
        command: [sh, -c]
368
        args:
369
          - |
370
            agent notify \
371
              --status "{{workflow.status}}" \
372
              --workflow "{{workflow.name}}" \
373
              --requirement-id "$REQUIREMENT_ID"
374
        env:
375
          - name: REQUIREMENT_ID
376
            value: "{{workflow.parameters.requirement_id}}"

应用模板：

1
kubectl apply -f workflowtemplate-ai-agent-dev-review.yaml

手动提交一次测试：

1
argo submit \
2
  --from workflowtemplate/ai-agent-dev-review \
3
  -n argo \
4
  -p repo_url=https://github.com/example/demo-service.git \
5
  -p base_branch=main \
6
  -p requirement_id=ISSUE-123 \
7
  -p requirement_text='给用户列表接口增加 name 模糊搜索，并补充单元测试' \
8
  -p requester=junnan

当流程跑到 wait-human-review 时会暂停。人工 Review 完成后恢复：

1
argo resume -n argo @latest

6. Argo Events：从 Webhook 自动触发#

如果需求来自内部系统，可以先用通用 Webhook。请求体约定如下：

1
{
2
  "repo_url": "https://github.com/example/demo-service.git",
3
  "base_branch": "main",
4
  "requirement_id": "REQ-2026-001",
5
  "requirement_text": "给订单查询接口增加按状态过滤，并补充测试",
6
  "requester": "alice"
7
}

6.1 EventSource#

1
apiVersion: argoproj.io/v1alpha1
2
kind: EventSource
3
metadata:
4
  name: ai-agent-webhook
5
  namespace: argo-events
6
spec:
7
  service:
8
    ports:
9
      - port: 12000
10
        targetPort: 12000
11
  webhook:
12
    requirement:
13
      port: "12000"
14
      endpoint: /requirements
15
      method: POST

应用：

1
kubectl apply -f eventsource-ai-agent-webhook.yaml

测试时可以先 port-forward：

1
kubectl -n argo-events port-forward svc/ai-agent-webhook-eventsource-svc 12000:12000

发送事件：

1
curl -X POST http://localhost:12000/requirements \
2
  -H 'Content-Type: application/json' \
3
  -d '{
4
    "repo_url": "https://github.com/example/demo-service.git",
5
    "base_branch": "main",
6
    "requirement_id": "REQ-2026-001",
7
    "requirement_text": "给订单查询接口增加按状态过滤，并补充测试",
8
    "requester": "alice"
9
  }'

6.2 Sensor RBAC#

Sensor 需要有权限在 argo namespace 创建 Workflow。

1
apiVersion: v1
2
kind: ServiceAccount
3
metadata:
4
  name: ai-agent-sensor
5
  namespace: argo-events
6
---
7
apiVersion: rbac.authorization.k8s.io/v1
8
kind: Role
9
metadata:
10
  name: ai-agent-sensor-submit-workflow
11
  namespace: argo
12
rules:
13
  - apiGroups: ["argoproj.io"]
14
    resources: ["workflows", "workflowtemplates"]
15
    verbs: ["get", "list", "create"]
16
---
17
apiVersion: rbac.authorization.k8s.io/v1
18
kind: RoleBinding
19
metadata:
20
  name: ai-agent-sensor-submit-workflow
21
  namespace: argo
22
subjects:
23
  - kind: ServiceAccount
24
    name: ai-agent-sensor
25
    namespace: argo-events
26
roleRef:
27
  kind: Role
28
  name: ai-agent-sensor-submit-workflow
29
  apiGroup: rbac.authorization.k8s.io

6.3 Sensor#

Sensor 从 EventBus 中消费事件，并把 JSON 字段映射为 Workflow 参数。

1
apiVersion: argoproj.io/v1alpha1
2
kind: Sensor
3
metadata:
4
  name: ai-agent-requirement-sensor
5
  namespace: argo-events
6
spec:
7
  template:
8
    serviceAccountName: ai-agent-sensor
9
  dependencies:
10
    - name: requirement-webhook
11
      eventSourceName: ai-agent-webhook
12
      eventName: requirement
13
  triggers:
14
    - template:
15
        name: submit-ai-agent-workflow
16
        argoWorkflow:
17
          operation: submit
18
          source:
19
            resource:
20
              apiVersion: argoproj.io/v1alpha1
21
              kind: Workflow
22
              metadata:
23
                generateName: ai-agent-dev-
24
                namespace: argo
25
              spec:
26
                workflowTemplateRef:
27
                  name: ai-agent-dev-review
28
                arguments:
29
                  parameters:
30
                    - name: repo_url
31
                      value: ""
32
                    - name: base_branch
33
                      value: main
34
                    - name: requirement_id
35
                      value: ""
36
                    - name: requirement_text
37
                      value: ""
38
                    - name: requester
39
                      value: ""
40
          parameters:
41
            - src:
42
                dependencyName: requirement-webhook
43
                dataKey: body.repo_url
44
              dest: spec.arguments.parameters.0.value
45
            - src:
46
                dependencyName: requirement-webhook
47
                dataKey: body.base_branch
48
              dest: spec.arguments.parameters.1.value
49
            - src:
50
                dependencyName: requirement-webhook
51
                dataKey: body.requirement_id
52
              dest: spec.arguments.parameters.2.value
53
            - src:
54
                dependencyName: requirement-webhook
55
                dataKey: body.requirement_text
56
              dest: spec.arguments.parameters.3.value
57
            - src:
58
                dependencyName: requirement-webhook
59
                dataKey: body.requester
60
              dest: spec.arguments.parameters.4.value

应用：

1
kubectl apply -f sensor-ai-agent-requirement.yaml

验证：

1
kubectl get eventsource,sensor,eventbus -n argo-events
2
kubectl get workflows -n argo

7. 如果需求来自 GitHub Issue#

生产里更常见的是 GitHub Issue/PR comment 触发。链路一样，只是 EventSource 从通用 webhook 换成 GitHub event source。

示意配置：

1
apiVersion: argoproj.io/v1alpha1
2
kind: EventSource
3
metadata:
4
  name: github-issue-eventsource
5
  namespace: argo-events
6
spec:
7
  github:
8
    aiAgentIssue:
9
      repositories:
10
        - owner: example
11
          names:
12
            - demo-service
13
      webhook:
14
        endpoint: /github
15
        port: "12000"
16
        method: POST
17
        url: https://argo-events.example.com
18
      events:
19
        - issues
20
      apiToken:
21
        name: github-webhook-secret
22
        key: token
23
      webhookSecret:
24
        name: github-webhook-secret
25
        key: secret
26
      insecure: false
27
      active: true
28
      contentType: json

然后在 Sensor 里加 filter，只处理带有 ai-agent label 的 issue：

1
dependencies:
2
  - name: github-issue
3
    eventSourceName: github-issue-eventsource
4
    eventName: aiAgentIssue
5
    filters:
6
      data:
7
        - path: body.action
8
          type: string
9
          value:
10
            - opened
11
            - labeled
12
        - path: body.issue.labels.#.name
13
          type: string
14
          value:
15
            - ai-agent

不同 Argo Events 版本对复杂 JSON path/filter 的表现要以实际测试为准。如果 filter 逻辑变复杂，我更推荐让 Sensor 只做基础过滤，进入第一个 parse-requirement 容器后再做严格校验。

8. Artifact Repository：保存 Agent 产物#

上面的模板使用了 artifact。Argo 官方文档也提醒，运行 artifact 示例前需要先配置 artifact repository。常见选择有：

S3；
MinIO；
GCS；
Azure Blob；
OSS；
自定义 artifact driver。

一个 S3 示例：

1
apiVersion: v1
2
kind: ConfigMap
3
metadata:
4
  name: artifact-repositories
5
  namespace: argo
6
  annotations:
7
    workflows.argoproj.io/default-artifact-repository: default-v1
8
data:
9
  default-v1: |
10
    s3:
11
      bucket: ai-agent-workflow-artifacts
12
      endpoint: s3.amazonaws.com
13
      region: us-east-1
14
      useSDKCreds: true

如果用静态 AK/SK：

1
apiVersion: v1
2
kind: Secret
3
metadata:
4
  name: s3-credentials
5
  namespace: argo
6
type: Opaque
7
stringData:
8
  accessKey: replace_me
9
  secretKey: replace_me
10
---
11
apiVersion: v1
12
kind: ConfigMap
13
metadata:
14
  name: artifact-repositories
15
  namespace: argo
16
  annotations:
17
    workflows.argoproj.io/default-artifact-repository: default-v1
18
data:
19
  default-v1: |
20
    s3:
21
      bucket: ai-agent-workflow-artifacts
22
      endpoint: minio.minio.svc.cluster.local:9000
23
      insecure: true
24
      accessKeySecret:
25
        name: s3-credentials
26
        key: accessKey
27
      secretKeySecret:
28
        name: s3-credentials
29
        key: secretKey

Artifact 里建议保存：

原始需求快照；
Agent plan；
修改后的 workspace 或 patch；
lint/test/security 报告；
PR 描述；
Agent 对自己修改的解释；
失败日志。

这些产物后续可以用于审计、复盘、评估模型效果，也可以喂给下一轮 Agent 修复。

9. Review 设计：不要让 Agent 自动合并#

AI Agent 自动开发最容易踩坑的点，不是能不能写代码，而是“写完以后谁负责质量”。

建议把自动化等级拆成四档：

等级	行为	适用场景
L1	只生成建议和 patch，不 push	高风险仓库、初期试点
L2	自动 push 分支并创建 PR	常规业务仓库
L3	自动修复测试失败并更新 PR	测试体系较完备的仓库
L4	自动合并低风险变更	文档、配置、小范围低风险代码

大多数团队应该从 L2 开始：Agent 可以创建 PR，但不能合并。

在 Argo 里，suspend 适合作为“流程暂停点”：

1
- name: wait-human-review
2
  suspend: {}

恢复方式：

1
argo resume -n argo <workflow-name>

如果想和 GitHub Review 更紧密，可以做一个补充 Sensor：

监听 PR approved 事件；
找到对应 Workflow；
调用 Argo CLI/API resume；
继续执行 merge、notify 或 archive。

不过我更推荐第一阶段先手动 resume。自动关联 PR Review 和 Workflow 状态虽然酷，但会增加不少边界条件。

10. 一个更轻量的 Steps 版本#

如果你刚开始试，不一定要上 DAG。下面是更容易读的 steps 版本：

1
apiVersion: argoproj.io/v1alpha1
2
kind: Workflow
3
metadata:
4
  generateName: ai-agent-simple-
5
  namespace: argo
6
spec:
7
  entrypoint: ai-agent-simple
8
  arguments:
9
    parameters:
10
      - name: requirement_text
11
        value: "给用户列表接口增加 name 模糊搜索"
12
  templates:
13
    - name: ai-agent-simple
14
      steps:
15
        - - name: plan
16
            template: run
17
            arguments:
18
              parameters:
19
                - name: command
20
                  value: "agent plan --text '{{workflow.parameters.requirement_text}}'"
21
        - - name: code
22
            template: run
23
            arguments:
24
              parameters:
25
                - name: command
26
                  value: "agent code"
27
        - - name: test
28
            template: run
29
            arguments:
30
              parameters:
31
                - name: command
32
                  value: "agent test"
33
        - - name: create-pr
34
            template: run
35
            arguments:
36
              parameters:
37
                - name: command
38
                  value: "agent create-pr"
39
        - - name: wait-review
40
            template: wait-review
41

42
    - name: run
43
      inputs:
44
        parameters:
45
          - name: command
46
      container:
47
        image: ghcr.io/example/ai-agent-runner:0.1.0
48
        command: [sh, -c]
49
        args: ["{{inputs.parameters.command}}"]
50

51
    - name: wait-review
52
      suspend: {}

steps 的好处是简单；DAG 的好处是并行和依赖表达更强。AI 自动开发这种场景，一旦你要并行跑 lint/test/security/doc check，DAG 更合适。

11. 生产化建议#

11.1 沙箱隔离#

Agent 执行环境要尽量收紧：

使用独立 namespace；
禁止特权容器；
使用只读根文件系统；
限制 CPU/内存；
限制出网域名；
对每个仓库使用不同 token；
不挂载 Kubernetes 高权限 ServiceAccount；
不允许访问生产 Secret。

11.2 Git 权限#

Git token 只给这些权限：

read repository；
create branch；
push 到 ai-agent/*；
create/update Pull Request；
comment on issue/PR。

不要给：

push main；
delete branch；
admin repo；
manage secrets；
bypass branch protection。

11.3 质量门禁#

建议至少有这些检查：

代码格式化；
lint；
unit test；
dependency scan；
secret scan；
SAST；
变更文件数量限制；
大文件检查；
PR 描述必须包含测试结果；
CODEOWNERS 强制 Review。

11.4 Agent 输出结构化#

不要只让 Agent 输出自然语言。建议每一步都输出结构化文件：

1
{
2
  "requirement_id": "REQ-2026-001",
3
  "summary": "增加订单状态过滤",
4
  "changed_files": [
5
    "src/orders/controller.ts",
6
    "src/orders/service.ts",
7
    "test/orders.service.spec.ts"
8
  ],
9
  "risk_level": "medium",
10
  "tests": {
11
    "command": "pnpm test",
12
    "status": "passed"
13
  },
14
  "requires_human_attention": true
15
}

这样 Argo 后续步骤、通知系统、审计系统都能消费。

11.5 失败重试策略#

Argo 支持在模板级别配置 retryStrategy。AI Agent 场景里建议分类型处理：

网络、模型 API 超时：可以重试；
lint/test 失败：不要盲目重试，应该进入修复步骤或生成失败报告；
secret scan 失败：直接停止并通知；
创建 PR 失败：可重试，但要避免重复 PR。

示例：

1
retryStrategy:
2
  limit: 2
3
  retryPolicy: OnError
4
  backoff:
5
    duration: "30s"
6
    factor: 2
7
    maxDuration: "5m"

12. 什么时候不建议用 Argo#

下面这些情况，不一定适合引入 Argo：

团队没有 Kubernetes 运维能力
Argo 的优势建立在 Kubernetes 基础设施之上。如果只是一个小仓库自动改代码，GitHub Actions 可能更简单。
流程非常短
只有“收到 issue -> 调 API -> 发评论”三个动作，用 serverless function 或普通 worker 就够了。
需要复杂人工表单审批
Argo 的暂停/恢复够用，但不是审批系统。复杂审批应该接入 Jira、飞书、ServiceNow、Backstage 或自研平台。
Agent 需要长时间交互式开发
Argo 更适合批处理式、阶段式任务。强交互 IDE Agent 不适合完全塞进 Workflow。

13. 最小落地路径#

如果我是从零建设，会按下面顺序推进：

第 1 周：手动触发 Workflow
先不用 Argo Events，只用 argo submit --from workflowtemplate/...，验证 Agent 镜像能完成 clone、plan、code、test、create-pr。
第 2 周：接入 Webhook
用 Argo Events 接内部需求系统或 GitHub Issue 事件，完成自动触发。
第 3 周：补齐 Artifact 和 Review 报告
把每一步产物保存到 S3/MinIO，让 PR 描述包含变更摘要、测试结果、风险提示。
第 4 周：加权限和质量门禁
拆 ServiceAccount、Git token、NetworkPolicy、secret scan、CODEOWNERS。
第 5 周以后：让 Agent 处理失败反馈
对测试失败的 PR，触发二次修复 Workflow，但仍然只更新 PR，不自动合并。

14. 总结#

Argo Workflows 可以满足 AI Agent 自动化开发工作流的核心编排需求，尤其适合 Kubernetes 环境中的团队。它能把“需求进入、Agent 开发、测试扫描、PR 创建、人工 Review、通知收尾”变成可声明、可观测、可重试、可审计的流水线。

但要记住边界：

Argo 是编排器，不是 Agent；
Argo Events 负责事件入口，不负责需求理解；
Agent 可以写代码，但 Review 和合并策略必须由工程制度兜底；
生产可用的关键不在 YAML 多复杂，而在权限、沙箱、产物、质量门禁和人工审批设计。

推荐的第一版落地形态是：

1
GitHub Issue/Webhook
2
  -> Argo Events
3
  -> Argo WorkflowTemplate
4
  -> Agent 生成分支和 PR
5
  -> 自动测试/扫描
6
  -> 人工 Review
7
  -> 手动合并

这条链路足够实用，也给后续更高等级的自动化留下空间。