本文是 Hermes Agent 教学系列 第 10 篇。把 Hermes 从本地搬上服务器,让他 24/7 在线。
为什么要上云
Hermes 本地跑是入门。但你思考一下这些场景:
- 笔记本一合盖 Hermes 就死了,手机 Telegram 就联线不上
- 定时任务跑在本机,出门在外周末不能干活
- 要让 Slack webhook 接进来,本地 IP 外网抿不到
- 多人一起用同一个 Hermes,本地服务器不够生产机型
所以谈“上生产”,部署有几种路径选:权衡成本、运维费劲、几个能力三件事上。
三种主流部署路径
路径 1:$5 VPS(最低门槛)
适合个人使用、轻载负、主要是 Telegram/Discord 闲聊。
场仓 Linode / DigitalOcean / Vultr 量低机型:1 vCPU + 1GB RAM。
安装过程:
必要的防火墙设置:
优点:便宜、控制力高、所有数据在你服务器上。
缺点:需要 Linux 运维能力,装不了本地大模型。
路径 2:Daytona / Modal serverless
这是 Hermes 官方推荐的未来路径。特点:空闲休眠,有任务唤醒。
Daytona 部署:
优点:空闲时几乎零成本(文档说“几乎零”,实际上个人使用一个月 $5以下)。快速伸缩,多子任务并行能肩起。维护护低。
缺点:冷启动延迟(第一条消息唤醒,2-3 秒才响应)。依赖云服务可用性。
Modal 逻辑类似,但更适合需要 GPU 的场景(本地跑 LLM、跳出生成)。
路径 3:自建专用服务器(企业/生产)
适合:
- 公司场景,多人共用
- 要跑 Ollama 本地 LLM
- 合规要求数据不出內
环境:专服/云 GPU 实例,推荐 Ubuntu Server LTS。
会启动三个服务:
hermes-core—— 主 agent
hermes-gateway—— 消息平台连接
ollama(可选)—— 本地 LLM
进阶:加 reverse proxy(nginx / caddy)、HTTPS、Prometheus 监控。
选哪个?决策表
你的场景 | 推荐 |
个人助手,每天调用 < 100 次 | $5 VPS |
个人+多设备,偷懒不想运维 | Daytona |
需要本地 LLM,零泄露 | 专服/云 GPU |
多人、Slack 接入、需要 webhook | $20 VPS 或 纯 Daytona |
大量并行子 agent | Modal |
必做的五件事
上生产后,这几件事一定要做:
1. HTTPS 与域名
Slack / Discord webhook 要求 HTTPS。推荐 Caddy,配置最简:
Caddy 自动申请 Let's Encrypt 证书。
2. 资源控制
LLM 会烧 token,有 bug 的任务会烧集中。设限额:
超限了会怎么样?打包报到 Telegram 调你补额额。
3. 备份记忆
记忆数据库过错不可避免。拼个定时任务:
4. 监控其记贫
Hermes 各发 Prometheus 指标,接入 Grafana:
关键指标:
- token 消耗速率
- 调用错误率
- 子 agent 启动耗时
- 记忆库查询耗时
5. 设计 fail-safe
LLM 会出错,中间 API 会超时,调用三方服务会 503。在 prompt 里加上「出错不要繼续,发 Telegram 提醒你」:
迁移:从本地到云端
在本地跑了一阵,记忆和 skills 都积了,不想丢?迁过去:
下一篇
现在 Hermes 在云端跑起来了,但能拿它干什么?下一篇是实战案例集——五个能拼怎么动手跱一跱的真实场景,你可以直接拿去改。
本系列文章持续更新,下篇见。
- 作者:Vemperor
- 链接:https://tangly1024.com/article/hermes-10-deploy
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。


