毓惶博客

本文是 Hermes Agent 教学系列 第 03 篇。上一篇装上了,这一篇跟它说上话,跟它干点东西。

启动 CLI

会进入交互式会话。你会看到类似这样的提示符:

在 > 后面直接输你想说的话就行。Hermes 会边思考边调用工具,过程都能看到。

几个高频命令

请注意:以 / 开头的是 CLI 内置命令(跟模型无关),不用 / 的是你跟模型说的话。

命令	用途
`/help`	罗列所有可用命令
`/clear`	清空当前会话上下文(但记忆不丢)
`/history`	查看近期会话
`/skills`	列出现有 skills
`/memory search <关键词>`	在记忆里检索
`/model`	查看或临时切换模型
`/exit` 或 Ctrl+D	退出

特别说一下 /clear 跟 /exit 的区别:

/clear 只是重置当前轮上下文,记忆库里的东西还在

/exit 退出进程,下次 hermes 启动它还记得之前的事情(这是跟 ChatGPT 本质不同的点)

40+ 内置工具都有什么

不用你手动开,装完就都在。按类别列:

网络与信息

web_search —— 调用搜索引擎

web_fetch —— 拉取完整页面内容

browser —— 启动带状态的浏览器(能点击、填表、截图)

vision —— 看图理解

文件与开发

read_file / write_file / edit_file

run_shell —— 执行 shell 命令(默认需要授权)

python —— 运行任意 Python 脚本

git —— 仓库操作

生成与输出

image_gen —— 生成图像

tts —— 文本转语音

speech_to_text

Hermes 自身控制

memory —— 读写记忆

skill —— 创建/调用 skill

schedule —— 添加定时任务

delegate —— 派发子 agent

完整列表在 /help tools。重点:大多数场景你不需要记这些工具名,直接用自然语言描述任务,Hermes 自己会选。

走一个真实任务

不说虚的,上个例子。任务:「去 GitHub 拉 NousResearch/hermes-agent 这个仓库的 README,帮我翻译成中文并结构化为个人笔记」。

你会看到 Hermes 输出类似:

几个值得看的细节:

思考过程透明 —— Hermes 会告诉你它打算用哪个工具、为什么,不是黑盒子

主动取舍 —— 该一次拉完的东西不会拆成十次凑 token,该调工具的不会偏要凭记忆胡余

输出落到磁盘 —— write_file 会产生一个实际文件,不是隐藏在会话里的文本

权限控制

默认配置下,Hermes 在执行以下动作前会问你:

运行任意 shell 命令

写入或修改文件

访问记忆库(某些敏感操作)

调用付费的外部服务

如果你讨厌反复确认(我是),可以:

建议:刚上手别开 dangerously,先用着看 Hermes 会干什么心里有数了再开。它是自主 agent,不给边界会看到一些意想不到的动作。

试试这几个入门任务

装完后推荐跑过一遍,你会对 Hermes 的能力边界有个加减法:

「总结下今天 Hacker News 首页前 10 条,按领域分类」 —— 考 web_search + 合成

「看这张 PNG 截图,告诉我里面是什么 UI 问题」 —— 考 vision

「拉 OpenAI 最新的 blog post,生成一个中文播客脚本,然后用 TTS 生成音频」 —— 多工具串联

「在 ~/projects 里找出近 7 天修改过的文件,生成一份变更报告」 —— 考 shell + 分析

CLI 玩熟了,下一篇把他从终端里补出来——接入 Telegram / Discord / Slack,从手机上跟他说话。

本系列文章持续更新,下篇见。

Menu

Menu

启动 CLI

几个高频命令

40+ 内置工具都有什么

走一个真实任务

权限控制

试试这几个入门任务

下一篇

Vemperor

Vemperor

技能栈

年度写作目标

交流频道

加入我们的社群讨论分享

分类排行