Lazy loaded image
🏇Hermes Agent 教学 10 | 部署到云端
字数 1271阅读时长 4 分钟
2026-4-23
本文是 Hermes Agent 教学系列 第 10 篇。把 Hermes 从本地搬上服务器,让他 24/7 在线。

为什么要上云

Hermes 本地跑是入门。但你思考一下这些场景:
  • 笔记本一合盖 Hermes 就死了,手机 Telegram 就联线不上
  • 定时任务跑在本机,出门在外周末不能干活
  • 要让 Slack webhook 接进来,本地 IP 外网抿不到
  • 多人一起用同一个 Hermes,本地服务器不够生产机型
所以谈“上生产”,部署有几种路径选:权衡成本、运维费劲、几个能力三件事上。

三种主流部署路径

路径 1:$5 VPS(最低门槛)

适合个人使用、轻载负、主要是 Telegram/Discord 闲聊。
场仓 Linode / DigitalOcean / Vultr 量低机型:1 vCPU + 1GB RAM。
安装过程:
必要的防火墙设置:
优点:便宜、控制力高、所有数据在你服务器上。
缺点:需要 Linux 运维能力,装不了本地大模型。

路径 2:Daytona / Modal serverless

这是 Hermes 官方推荐的未来路径。特点:空闲休眠,有任务唤醒。
Daytona 部署:
优点:空闲时几乎零成本(文档说“几乎零”,实际上个人使用一个月 $5以下)。快速伸缩,多子任务并行能肩起。维护护低。
缺点:冷启动延迟(第一条消息唤醒,2-3 秒才响应)。依赖云服务可用性。
Modal 逻辑类似,但更适合需要 GPU 的场景(本地跑 LLM、跳出生成)。

路径 3:自建专用服务器(企业/生产)

适合:
  • 公司场景,多人共用
  • 要跑 Ollama 本地 LLM
  • 合规要求数据不出內
环境:专服/云 GPU 实例,推荐 Ubuntu Server LTS。
会启动三个服务:
  • hermes-core —— 主 agent
  • hermes-gateway —— 消息平台连接
  • ollama(可选)—— 本地 LLM
进阶:加 reverse proxy(nginx / caddy)、HTTPS、Prometheus 监控。

选哪个?决策表

你的场景
推荐
个人助手,每天调用 < 100 次
$5 VPS
个人+多设备,偷懒不想运维
Daytona
需要本地 LLM,零泄露
专服/云 GPU
多人、Slack 接入、需要 webhook
$20 VPS 或 纯 Daytona
大量并行子 agent
Modal

必做的五件事

上生产后,这几件事一定要做:

1. HTTPS 与域名

Slack / Discord webhook 要求 HTTPS。推荐 Caddy,配置最简:
Caddy 自动申请 Let's Encrypt 证书。

2. 资源控制

LLM 会烧 token,有 bug 的任务会烧集中。设限额:
超限了会怎么样?打包报到 Telegram 调你补额额。

3. 备份记忆

记忆数据库过错不可避免。拼个定时任务:

4. 监控其记贫

Hermes 各发 Prometheus 指标,接入 Grafana:
关键指标:
  • token 消耗速率
  • 调用错误率
  • 子 agent 启动耗时
  • 记忆库查询耗时

5. 设计 fail-safe

LLM 会出错,中间 API 会超时,调用三方服务会 503。在 prompt 里加上「出错不要繼续,发 Telegram 提醒你」:

迁移:从本地到云端

在本地跑了一阵,记忆和 skills 都积了,不想丢?迁过去:

下一篇

现在 Hermes 在云端跑起来了,但能拿它干什么?下一篇是实战案例集——五个能拼怎么动手跱一跱的真实场景,你可以直接拿去改。

本系列文章持续更新,下篇见。
上一篇
Hermes Agent 教学 11 | 实战案例集
下一篇
Hermes Agent 教学 09 | 子 agent 与并行