把 AI Agent 部署到云端:用手机实现 7/24 小时编码与审核
把 AI Agent 部署到云端:用手机实现 7/24 小时编码与审核
以前写代码有一个很明确的前提:人必须坐在电脑前。
你需要打开 IDE,拉代码,读报错,改文件,跑测试,提交 commit,再去 GitHub 上看 CI。哪怕只是一个很小的 bug,也经常会被完整的桌面工作流绑住。
但 AI Agent 出现之后,这个前提开始松动了。
如果把 Hermes、OpenClaw 或其他类似的 Agent 部署在云端,再把它接入 Telegram、Discord、WhatsApp、微信这类手机通讯软件,那么手机就不只是一个接收通知的设备,而可以变成一个全天候的开发控制台。
你在手机上发一句:
帮我检查一下这个 repo 里为什么 build 失败,修完后开一个 PR,先不要 merge。
Agent 可以在云端机器上拉代码、读日志、修改文件、运行测试、生成总结,再把结果发回手机。你不需要一直在线,也不需要一直盯着终端。
这就是我理解的 7/24 小时编码与审核工作流。
一、核心变化:手机不写代码,手机下达任务
这套模式最重要的点不是“在手机上写代码”。
手机屏幕太小,用它手搓复杂代码并不舒服。真正有价值的是:手机变成一个任务调度器。
传统开发方式是:
- 打开电脑
- 打开项目
- 找问题
- 修改代码
- 跑测试
- 总结结果
- 提交或 review
云端 Agent 工作流变成:
- 手机上发任务
- Agent 在云端执行
- Agent 把 diff、测试结果、风险点发回来
- 人类在手机上确认、拒绝或继续追问
所以人的角色从“操作员”变成了“审核者”和“决策者”。
这很像你多了一个远程实习生:它可以一直待命,可以跑命令,可以读项目,可以改代码。但最终决定权仍然应该在人手里。
二、基本架构:VPS + Agent + 通讯软件 + GitHub
一个比较现实的架构可以长这样:
手机通讯软件
Telegram / Discord / WhatsApp / WeChat
|
v
消息网关 / Bot Gateway
|
v
云端 Agent
Hermes / OpenClaw / 自建 Agent
|
v
开发环境
Git repo / Docker / Node / Python / Rust / Java
|
v
代码平台
GitHub / GitLab / Gitea
云端机器可以是:
- AWS EC2
- Oracle Cloud VM
- Hetzner VPS
- DigitalOcean Droplet
- 自己家里的 Linux 服务器
- 一台长期在线的 Mac mini 或小主机
Agent 负责接收消息、理解任务、调用工具和返回结果。
通讯软件负责让你随时随地控制它。
GitHub 或其他代码平台负责记录代码变更、跑 CI、生成 PR,并保留审查历史。
三、一个真实的工作流例子
假设我在外面,手机收到 GitHub Actions 通知:项目 build 失败。
以前我可能只能等回家再处理。现在可以直接给 Agent 发消息:
进入 my-blog repo,检查最新一次 CI 失败原因。如果是 TypeScript 类型错误,修复它,跑 npm run build,通过后开 PR。不要直接推 main。
Agent 的理想执行过程是:
- 进入指定 repo
- 拉取最新代码
- 查看 CI 日志或本地复现错误
- 新建修复分支
- 修改相关文件
- 运行测试或 build
- 生成 commit
- 打开 PR
- 把摘要发回手机
它发回来的结果应该不是一句“完成了”,而应该类似:
已完成初步修复:
分支:
fix/blog-type-error
修改文件:
- src/components/PostCard.tsx
- src/lib/posts.ts
问题原因:
PostCard 组件要求 date 为 string,但 posts.ts 中部分文章 date 缺失。
修复方式:
为缺失 date 的文章补充默认 date,并在类型定义中增加校验。
验证:
- npm run typecheck ✅
- npm run build ✅
建议:
可以 review PR,但不要直接 merge;我建议检查文章排序逻辑是否符合预期。
这才是有用的 Agent 回复。
它必须告诉你改了什么、为什么改、怎么验证、还有哪些风险。
四、为什么云端部署比本地电脑更适合 7/24
本地电脑最大的问题是:它不是一直在线。
电脑会睡眠、断网、没电,也可能被你拿去打游戏、重启系统或者切换环境。对于一个需要持续响应的 Agent 来说,本地电脑不是最稳定的运行位置。
云端 VPS 的优势是:
- 持续在线
- 网络稳定
- 可以用 systemd 或 Docker 自动重启服务
- 可以固定运行开发环境
- 可以长期保存日志和任务记录
- 可以和 GitHub、消息平台、CI 系统稳定连接
这也是为什么 Hermes、OpenClaw 这类 Agent 很适合部署在服务器上。
手机负责发号施令,服务器负责干活。
五、它适合做什么?
我觉得这种 7/24 Agent 最适合处理这些任务:
1. 小型 bug 修复
比如:
- TypeScript 类型错误
- lint 失败
- build 配置问题
- README 更新
- API 字段改名
- 简单 UI 文案调整
这类问题边界明确,Agent 容易验证。
2. 自动 review
你可以让它检查:
- 这次 PR 改了什么
- 有没有明显 bug
- 有没有安全风险
- 有没有破坏类型定义
- 有没有缺少测试
- 有没有写出过度复杂的代码
重点是:Agent 不应该替你做最终决定,而应该帮你减少 review 成本。
3. 生成报告
例如每天晚上自动总结:
- 今天 repo 有哪些 commit
- 哪些 issue 还没处理
- CI 有没有失败
- 哪些依赖需要升级
- 哪些 TODO 还没解决
这些东西人工整理很烦,但非常适合 Agent。
4. 云端运维检查
比如:
- 检查服务是否挂了
- 查看日志
- 重启开发环境
- 检查磁盘空间
- 检查 Docker container 状态
- 汇报服务器资源使用情况
这类任务不一定要人亲自 SSH 上去敲命令。
六、但别把它当成魔法
这套工作流很强,但也很危险。
一个能改代码、跑命令、访问 GitHub、读取环境变量的 Agent,本质上拥有很高权限。如果配置不当,它可能造成严重后果。
至少要有这些限制:
1. 不要给 root 权限
Agent 不应该默认拥有服务器最高权限。它应该运行在单独用户下,只能访问必要目录。
2. 不要把生产密钥暴露给它
开发环境和生产环境必须分开。Agent 可以有 GitHub token、测试数据库权限、临时 API key,但不应该直接拿到生产数据库密码。
3. 不要允许直接 push main
比较安全的做法是:
- 只能创建 branch
- 只能开 PR
- 不能直接 merge
- 不能直接部署 production
- 高风险命令需要人工确认
4. 所有操作要留日志
你需要知道它什么时候执行了什么命令、改了哪些文件、调用了哪些工具。
Agent 不是越自由越好。真正适合长期使用的 Agent,一定要可审计、可回滚、可限制。
七、我理想中的手机 Agent 指令格式
随便发一句自然语言当然可以,但我更喜欢半结构化指令。
例如:
任务:修复博客项目 build 失败
仓库:my-blog
限制:
- 不要 push main
- 不要删除文章内容
- 不要改 package manager
- 修改后跑 npm run typecheck 和 npm run build
输出:
- 总结原因
- 列出修改文件
- 给出测试结果
- 如果成功,开 PR
这种写法比“帮我修一下”更稳定。
因为 Agent 最怕任务边界不清楚。边界越清楚,结果越可靠。
八、手机端真正爽的地方:碎片时间也能推进项目
这套系统最吸引我的地方,是它改变了“什么时候能推进项目”。
以前只有坐在电脑前才算工作。
现在很多碎片时间都可以变成轻量级开发调度时间:
- 等公交时,让 Agent 检查 CI
- 吃饭前,让 Agent 总结 issue
- 走路时,让 Agent 跑测试
- 睡前,让 Agent 尝试修复小 bug
- 第二天醒来,看它整理好的结果
这不是让人 24 小时工作。
恰恰相反,它是把重复性操作丢给云端,把人从终端前解放出来。
人只做三件事:
- 定义目标
- 审核结果
- 决定是否合并
九、我的结论
云端 Agent + 手机通讯软件,可能会成为个人开发者非常重要的一种工作流。
它不会取代真正的软件工程能力。你仍然需要知道代码该怎么设计,系统该怎么部署,安全边界该怎么划。
但它会改变开发节奏。
电脑不再是唯一入口。手机可以成为随身携带的项目控制台。云端 Agent 可以成为长期在线的执行者。GitHub PR 可以成为人类审核的最终关口。
最理想的状态不是“AI 自动替我写完所有代码”。
而是:
我在任何地方都能启动任务,但每一次关键变更都由我审核。
这才是我认为比较健康的 7/24 编码与审核方式。
十、我真正想推动的方向
写这篇文章,核心并不是强调“命令行更强”。
我真正想推动的是另一件事:以后小白只需要在 Linux 上安装一个 Hermes、OpenClaw 或其他类似的 Agent,根本不需要什么可视化界面,也不需要背诵复杂命令行,所有操作都可以通过手机上的聊天界面完成。
用户不一定理解 VPS、SSH、systemd、Docker 或 GitHub Actions 的全部细节,依然可以通过自然语言告诉 Agent:
- 帮我部署
- 帮我看为什么挂了
- 帮我修这个错误
- 帮我开个分支试试看
- 帮我总结今天发生了什么
真正好的 Agent 工作流,应该是把底层复杂度藏起来,把控制权交还给用户。
不是每个人都要成为 Linux 高手,但每个人都可以拥有一个随时待命的云端开发助手。