毓惶博客

本文是 Hermes Agent 教学系列 第 10 篇。把 Hermes 从本地搬上服务器,让他 24/7 在线。

为什么要上云

Hermes 本地跑是入门。但你思考一下这些场景:

笔记本一合盖 Hermes 就死了,手机 Telegram 就联线不上

定时任务跑在本机,出门在外周末不能干活

要让 Slack webhook 接进来,本地 IP 外网抿不到

多人一起用同一个 Hermes,本地服务器不够生产机型

所以谈“上生产”,部署有几种路径选:权衡成本、运维费劲、几个能力三件事上。

三种主流部署路径

路径 1:$5 VPS(最低门槛)

适合个人使用、轻载负、主要是 Telegram/Discord 闲聊。

场仓 Linode / DigitalOcean / Vultr 量低机型:1 vCPU + 1GB RAM。

安装过程:

必要的防火墙设置:

优点:便宜、控制力高、所有数据在你服务器上。

缺点:需要 Linux 运维能力,装不了本地大模型。

路径 2:Daytona / Modal serverless

这是 Hermes 官方推荐的未来路径。特点:空闲休眠,有任务唤醒。

Daytona 部署:

优点:空闲时几乎零成本(文档说“几乎零”,实际上个人使用一个月 $5以下)。快速伸缩,多子任务并行能肩起。维护护低。

缺点:冷启动延迟(第一条消息唤醒,2-3 秒才响应)。依赖云服务可用性。

Modal 逻辑类似,但更适合需要 GPU 的场景(本地跑 LLM、跳出生成)。

路径 3:自建专用服务器(企业/生产)

适合:

公司场景,多人共用

要跑 Ollama 本地 LLM

合规要求数据不出內

环境:专服/云 GPU 实例,推荐 Ubuntu Server LTS。

会启动三个服务:

hermes-core —— 主 agent

hermes-gateway —— 消息平台连接

ollama(可选)—— 本地 LLM

进阶:加 reverse proxy(nginx / caddy)、HTTPS、Prometheus 监控。

选哪个?决策表

你的场景	推荐
个人助手,每天调用 < 100 次	$5 VPS
个人+多设备,偷懒不想运维	Daytona
需要本地 LLM,零泄露	专服/云 GPU
多人、Slack 接入、需要 webhook	$20 VPS 或纯 Daytona
大量并行子 agent	Modal

必做的五件事

上生产后,这几件事一定要做:

1. HTTPS 与域名

Slack / Discord webhook 要求 HTTPS。推荐 Caddy,配置最简:

Caddy 自动申请 Let's Encrypt 证书。

2. 资源控制

LLM 会烧 token,有 bug 的任务会烧集中。设限额:

超限了会怎么样?打包报到 Telegram 调你补额额。

3. 备份记忆

记忆数据库过错不可避免。拼个定时任务:

4. 监控其记贫

Hermes 各发 Prometheus 指标,接入 Grafana:

关键指标:

token 消耗速率

调用错误率

子 agent 启动耗时

记忆库查询耗时

5. 设计 fail-safe

LLM 会出错,中间 API 会超时,调用三方服务会 503。在 prompt 里加上「出错不要繼续,发 Telegram 提醒你」:

迁移:从本地到云端

在本地跑了一阵,记忆和 skills 都积了,不想丢?迁过去:

现在 Hermes 在云端跑起来了,但能拿它干什么?下一篇是实战案例集——五个能拼怎么动手跱一跱的真实场景,你可以直接拿去改。

本系列文章持续更新,下篇见。

Menu