Lazy loaded image
🏇Hermes Agent 教学 01 | 它是什么,凭什么值得装
字数 1447阅读时长 4 分钟
2026-4-14
本文是 Hermes Agent 教学系列 第 01 篇。系列共 12 篇,从安装到进阶实战,带你把这个开源 AI agent 真正用起来。

一句话先说清楚

Hermes Agent 是 Nous Research2026 年 2 月 发布的开源自主 AI agent,MIT 协议,代码在 GitHub
它的定位用官方原话说就是:「不是绑在 IDE 上的编程副驾,也不是套在某个 API 外面的聊天机器人壳子——它是一个住在你服务器上、记得它学过的东西、跑得越久越能干的自主 agent。」

为什么不用 ChatGPT 或 Claude 就够了?

你大概已经在用 ChatGPT、Claude 这类对话式 AI。它们很好用,但有几个共同的「天花板」:

1. 无状态(Stateless)

每开一个新会话,模型对你的过去一无所知。你昨天跟它解释了三遍的项目背景,今天还要再讲一遍。
Hermes 的核心架构在执行循环之外多加了一层——评估发生了什么、提取可复用的模式、存下来。同时跨会话建立用户模型(你的偏好、决策习惯、任务模式)。
用得越久,它越懂你。这是 Hermes 跟主流 agent 框架最关键的架构差异。

2. 跑在别人的服务器上

聊天窗口关掉,模型就停了。它不会在你睡觉的时候帮你处理收件箱、定时抓数据、监控某个网站。
Hermes 跑在你自己的机器上——可以是 $5 一个月的小 VPS,可以是本地 Linux,也可以是 serverless(Modal、Daytona),空闲时几乎零成本,有任务时自动唤醒。

3. 只在一个界面里

Claude.ai 只能在 claude.ai 用,Cursor 只能在 Cursor 用。
Hermes 一个 gateway 进程,同时挂在 CLI、Telegram、Discord、Slack、WhatsApp、Signal、Email、SMS、Matrix、钉钉、飞书、企业微信(共 15+ 平台)。早上在 Telegram 给它派任务,晚上在 Discord 看结果,无缝切换。

「会成长」具体指什么?

这是 Hermes 最容易被吹得很玄但其实有具体机制的部分。它的学习闭环是这样的:
具体落地成三个系统:
记忆系统:基于 SQLite FTS5 的全文检索,加上 LLM 自动摘要。它会主动「想起」相关的过去对话,而不是每次从零开始。
Skills 系统:成功完成一个非平凡任务后,Hermes 把解法抽象成一个命名的可复用 skill 文档。这些 skill 兼容 agentskills.io 开放标准,可以在社区共享。
用户建模:跨会话累积一个关于「你」的模型——你怎么工作、偏好什么、之前做过什么决定——下次任务自动套用。

它能干什么具体的事?

内置 40+ 工具,覆盖大多数日常场景:
  • 网页:搜索、内容提取、浏览器自动化、视觉理解、TTS
  • 任务调度:自然语言描述的 cron(「每周一早上 9 点把上周 GitHub 活跃度发我邮箱」)
  • 子 agent:派发隔离的子任务,各自有独立终端和 Python RPC,互不干扰主上下文
  • MCP 集成:接任何 MCP server,扩展到你需要的任何外部系统
  • 批量与训练:导出 trajectory 用于 RL 训练(Atropos 集成),适合研究场景

谁适合用 Hermes?

适合:
  • 想要一个 24/7 在线的个人 AI 助手,而不是只能在网页上聊天
  • 已经在用 Claude Code / OpenClaw 但希望 agent 能跨会话累积经验
  • 喜欢自托管、关心数据隐私(MIT 协议、本地运行、零遥测)
  • 团队场景:把 agent 接进 Slack/Discord,作为团队共享的助手
  • 研究场景:批量生成 trajectory、做 RL 实验
暂不适合:
  • 完全不想碰命令行的纯小白(虽然安装一行 curl 解决,但日常使用还是 CLI 思维)
  • 只用 Windows 原生且不愿装 WSL2(原生 Windows 不支持)
  • 期望「装上就懂我」的人——它需要时间积累记忆和 skill 才会真正变好用

跟 Claude Code、OpenClaw 的差别

维度
Claude Code
OpenClaw
Hermes Agent
定位
编程副驾
通用 agent
通用 agent + 学习闭环
跨会话记忆
有限
✅ FTS5 持久
自动技能创建
多平台接入
终端/IDE
终端
15+ 消息平台
部署后端
本地
本地
本地 / Docker / SSH / Daytona / Modal / Singularity
协议
商业
MIT
MIT
模型选择
仅 Claude
任意(Nous Portal / OpenRouter / Ollama / 自建)

系列后续会讲什么

  • 02 从零安装与初次配置
  • 03 基础使用:CLI 交互与第一个任务
  • 04 接入消息平台(Telegram / Discord / Slack)
  • 05 记忆系统揭秘
  • 06 Skills 系统:让 agent 自我成长
  • 07 MCP 集成与扩展工具
  • 08 定时任务与自动化
  • 09 进阶:子 agent 与并行
  • 10 部署到云端
  • 11 实战案例集
  • 12 常见坑与调试
下一篇我们直接动手装。如果你已经迫不及待:
但建议先看完 02 安装篇——里面有几个常见坑(尤其是 WSL2 用户)如果不提前知道,装到一半会卡住。

本系列文章持续更新,下篇见。
上一篇
Hermes Agent 教学 02 | 从零安装与初次配置
下一篇
每一项工程工作都应该使后续工作更容易,而不是更难