把 AI Agent 部署到云端:用手机实现 7/24 小时编码与审核

把 AI Agent 部署到云端:用手机实现 7/24 小时编码与审核

以前写代码有一个很明确的前提:人必须坐在电脑前。

你需要打开 IDE,拉代码,读报错,改文件,跑测试,提交 commit,再去 GitHub 上看 CI。哪怕只是一个很小的 bug,也经常会被完整的桌面工作流绑住。

但 AI Agent 出现之后,这个前提开始松动了。

如果把 Hermes、OpenClaw 或其他类似的 Agent 部署在云端,再把它接入 Telegram、Discord、WhatsApp、微信这类手机通讯软件,那么手机就不只是一个接收通知的设备,而可以变成一个全天候的开发控制台。

你在手机上发一句:

帮我检查一下这个 repo 里为什么 build 失败,修完后开一个 PR,先不要 merge。

Agent 可以在云端机器上拉代码、读日志、修改文件、运行测试、生成总结,再把结果发回手机。你不需要一直在线,也不需要一直盯着终端。

这就是我理解的 7/24 小时编码与审核工作流。


一、核心变化:手机不写代码,手机下达任务

这套模式最重要的点不是“在手机上写代码”。

手机屏幕太小,用它手搓复杂代码并不舒服。真正有价值的是:手机变成一个任务调度器。

传统开发方式是:

  1. 打开电脑
  2. 打开项目
  3. 找问题
  4. 修改代码
  5. 跑测试
  6. 总结结果
  7. 提交或 review

云端 Agent 工作流变成:

  1. 手机上发任务
  2. Agent 在云端执行
  3. Agent 把 diff、测试结果、风险点发回来
  4. 人类在手机上确认、拒绝或继续追问

所以人的角色从“操作员”变成了“审核者”和“决策者”。

这很像你多了一个远程实习生:它可以一直待命,可以跑命令,可以读项目,可以改代码。但最终决定权仍然应该在人手里。


二、基本架构:VPS + Agent + 通讯软件 + GitHub

一个比较现实的架构可以长这样:

手机通讯软件
Telegram / Discord / WhatsApp / WeChat
        |
        v
消息网关 / Bot Gateway
        |
        v
云端 Agent
Hermes / OpenClaw / 自建 Agent
        |
        v
开发环境
Git repo / Docker / Node / Python / Rust / Java
        |
        v
代码平台
GitHub / GitLab / Gitea

云端机器可以是:

  • AWS EC2
  • Oracle Cloud VM
  • Hetzner VPS
  • DigitalOcean Droplet
  • 自己家里的 Linux 服务器
  • 一台长期在线的 Mac mini 或小主机

Agent 负责接收消息、理解任务、调用工具和返回结果。

通讯软件负责让你随时随地控制它。

GitHub 或其他代码平台负责记录代码变更、跑 CI、生成 PR,并保留审查历史。


三、一个真实的工作流例子

假设我在外面,手机收到 GitHub Actions 通知:项目 build 失败。

以前我可能只能等回家再处理。现在可以直接给 Agent 发消息:

进入 my-blog repo,检查最新一次 CI 失败原因。如果是 TypeScript 类型错误,修复它,跑 npm run build,通过后开 PR。不要直接推 main。

Agent 的理想执行过程是:

  • 进入指定 repo
  • 拉取最新代码
  • 查看 CI 日志或本地复现错误
  • 新建修复分支
  • 修改相关文件
  • 运行测试或 build
  • 生成 commit
  • 打开 PR
  • 把摘要发回手机

它发回来的结果应该不是一句“完成了”,而应该类似:

已完成初步修复:

分支:
fix/blog-type-error

修改文件:
- src/components/PostCard.tsx
- src/lib/posts.ts

问题原因:
PostCard 组件要求 date 为 string,但 posts.ts 中部分文章 date 缺失。

修复方式:
为缺失 date 的文章补充默认 date,并在类型定义中增加校验。

验证:
- npm run typecheck ✅
- npm run build ✅

建议:
可以 review PR,但不要直接 merge;我建议检查文章排序逻辑是否符合预期。

这才是有用的 Agent 回复。

它必须告诉你改了什么、为什么改、怎么验证、还有哪些风险。


四、为什么云端部署比本地电脑更适合 7/24

本地电脑最大的问题是:它不是一直在线。

电脑会睡眠、断网、没电,也可能被你拿去打游戏、重启系统或者切换环境。对于一个需要持续响应的 Agent 来说,本地电脑不是最稳定的运行位置。

云端 VPS 的优势是:

  • 持续在线
  • 网络稳定
  • 可以用 systemd 或 Docker 自动重启服务
  • 可以固定运行开发环境
  • 可以长期保存日志和任务记录
  • 可以和 GitHub、消息平台、CI 系统稳定连接

这也是为什么 Hermes、OpenClaw 这类 Agent 很适合部署在服务器上。

手机负责发号施令,服务器负责干活。


五、它适合做什么?

我觉得这种 7/24 Agent 最适合处理这些任务:

1. 小型 bug 修复

比如:

  • TypeScript 类型错误
  • lint 失败
  • build 配置问题
  • README 更新
  • API 字段改名
  • 简单 UI 文案调整

这类问题边界明确,Agent 容易验证。

2. 自动 review

你可以让它检查:

  • 这次 PR 改了什么
  • 有没有明显 bug
  • 有没有安全风险
  • 有没有破坏类型定义
  • 有没有缺少测试
  • 有没有写出过度复杂的代码

重点是:Agent 不应该替你做最终决定,而应该帮你减少 review 成本。

3. 生成报告

例如每天晚上自动总结:

  • 今天 repo 有哪些 commit
  • 哪些 issue 还没处理
  • CI 有没有失败
  • 哪些依赖需要升级
  • 哪些 TODO 还没解决

这些东西人工整理很烦,但非常适合 Agent。

4. 云端运维检查

比如:

  • 检查服务是否挂了
  • 查看日志
  • 重启开发环境
  • 检查磁盘空间
  • 检查 Docker container 状态
  • 汇报服务器资源使用情况

这类任务不一定要人亲自 SSH 上去敲命令。


六、但别把它当成魔法

这套工作流很强,但也很危险。

一个能改代码、跑命令、访问 GitHub、读取环境变量的 Agent,本质上拥有很高权限。如果配置不当,它可能造成严重后果。

至少要有这些限制:

1. 不要给 root 权限

Agent 不应该默认拥有服务器最高权限。它应该运行在单独用户下,只能访问必要目录。

2. 不要把生产密钥暴露给它

开发环境和生产环境必须分开。Agent 可以有 GitHub token、测试数据库权限、临时 API key,但不应该直接拿到生产数据库密码。

3. 不要允许直接 push main

比较安全的做法是:

  • 只能创建 branch
  • 只能开 PR
  • 不能直接 merge
  • 不能直接部署 production
  • 高风险命令需要人工确认

4. 所有操作要留日志

你需要知道它什么时候执行了什么命令、改了哪些文件、调用了哪些工具。

Agent 不是越自由越好。真正适合长期使用的 Agent,一定要可审计、可回滚、可限制。


七、我理想中的手机 Agent 指令格式

随便发一句自然语言当然可以,但我更喜欢半结构化指令。

例如:

任务:修复博客项目 build 失败
仓库:my-blog
限制:
- 不要 push main
- 不要删除文章内容
- 不要改 package manager
- 修改后跑 npm run typecheck 和 npm run build
输出:
- 总结原因
- 列出修改文件
- 给出测试结果
- 如果成功,开 PR

这种写法比“帮我修一下”更稳定。

因为 Agent 最怕任务边界不清楚。边界越清楚,结果越可靠。


八、手机端真正爽的地方:碎片时间也能推进项目

这套系统最吸引我的地方,是它改变了“什么时候能推进项目”。

以前只有坐在电脑前才算工作。

现在很多碎片时间都可以变成轻量级开发调度时间:

  • 等公交时,让 Agent 检查 CI
  • 吃饭前,让 Agent 总结 issue
  • 走路时,让 Agent 跑测试
  • 睡前,让 Agent 尝试修复小 bug
  • 第二天醒来,看它整理好的结果

这不是让人 24 小时工作。

恰恰相反,它是把重复性操作丢给云端,把人从终端前解放出来。

人只做三件事:

  • 定义目标
  • 审核结果
  • 决定是否合并

九、我的结论

云端 Agent + 手机通讯软件,可能会成为个人开发者非常重要的一种工作流。

它不会取代真正的软件工程能力。你仍然需要知道代码该怎么设计,系统该怎么部署,安全边界该怎么划。

但它会改变开发节奏。

电脑不再是唯一入口。手机可以成为随身携带的项目控制台。云端 Agent 可以成为长期在线的执行者。GitHub PR 可以成为人类审核的最终关口。

最理想的状态不是“AI 自动替我写完所有代码”。

而是:

我在任何地方都能启动任务,但每一次关键变更都由我审核。

这才是我认为比较健康的 7/24 编码与审核方式。


十、我真正想推动的方向

写这篇文章,核心并不是强调“命令行更强”。

我真正想推动的是另一件事:以后小白只需要在 Linux 上安装一个 Hermes、OpenClaw 或其他类似的 Agent,根本不需要什么可视化界面,也不需要背诵复杂命令行,所有操作都可以通过手机上的聊天界面完成。

用户不一定理解 VPS、SSH、systemd、Docker 或 GitHub Actions 的全部细节,依然可以通过自然语言告诉 Agent:

  • 帮我部署
  • 帮我看为什么挂了
  • 帮我修这个错误
  • 帮我开个分支试试看
  • 帮我总结今天发生了什么

真正好的 Agent 工作流,应该是把底层复杂度藏起来,把控制权交还给用户。

不是每个人都要成为 Linux 高手,但每个人都可以拥有一个随时待命的云端开发助手。