本文是 Hermes Agent 教学系列 第 03 篇。上一篇装上了,这一篇跟它说上话,跟它干点东西。
启动 CLI
会进入交互式会话。你会看到类似这样的提示符:
在
> 后面直接输你想说的话就行。Hermes 会边思考边调用工具,过程都能看到。几个高频命令
请注意:以
/ 开头的是 CLI 内置命令(跟模型无关),不用 / 的是你跟模型说的话。命令 | 用途 |
/help | 罗列所有可用命令 |
/clear | 清空当前会话上下文(但记忆不丢) |
/history | 查看近期会话 |
/skills | 列出现有 skills |
/memory search <关键词> | 在记忆里检索 |
/model | 查看或临时切换模型 |
/exit 或 Ctrl+D | 退出 |
特别说一下
/clear 跟 /exit 的区别:/clear只是重置当前轮上下文,记忆库里的东西还在
/exit退出进程,下次hermes启动它还记得之前的事情(这是跟 ChatGPT 本质不同的点)
40+ 内置工具都有什么
不用你手动开,装完就都在。按类别列:
网络与信息
- web_search —— 调用搜索引擎
- web_fetch —— 拉取完整页面内容
- browser —— 启动带状态的浏览器(能点击、填表、截图)
- vision —— 看图理解
文件与开发
- read_file / write_file / edit_file
- run_shell —— 执行 shell 命令(默认需要授权)
- python —— 运行任意 Python 脚本
- git —— 仓库操作
生成与输出
- image_gen —— 生成图像
- tts —— 文本转语音
- speech_to_text
Hermes 自身控制
- memory —— 读写记忆
- skill —— 创建/调用 skill
- schedule —— 添加定时任务
- delegate —— 派发子 agent
完整列表在
/help tools。重点:大多数场景你不需要记这些工具名,直接用自然语言描述任务,Hermes 自己会选。走一个真实任务
不说虚的,上个例子。任务:「去 GitHub 拉 NousResearch/hermes-agent 这个仓库的 README,帮我翻译成中文并结构化为个人笔记」。
你会看到 Hermes 输出类似:
几个值得看的细节:
- 思考过程透明 —— Hermes 会告诉你它打算用哪个工具、为什么,不是黑盒子
- 主动取舍 —— 该一次拉完的东西不会拆成十次凑 token,该调工具的不会偏要凭记忆胡余
- 输出落到磁盘 ——
write_file会产生一个实际文件,不是隐藏在会话里的文本
权限控制
默认配置下,Hermes 在执行以下动作前会问你:
- 运行任意 shell 命令
- 写入或修改文件
- 访问记忆库(某些敏感操作)
- 调用付费的外部服务
如果你讨厌反复确认(我是),可以:
建议:刚上手别开 dangerously,先用着看 Hermes 会干什么心里有数了再开。它是自主 agent,不给边界会看到一些意想不到的动作。
试试这几个入门任务
装完后推荐跑过一遍,你会对 Hermes 的能力边界有个加减法:
- 「总结下今天 Hacker News 首页前 10 条,按领域分类」 —— 考 web_search + 合成
- 「看这张 PNG 截图,告诉我里面是什么 UI 问题」 —— 考 vision
- 「拉 OpenAI 最新的 blog post,生成一个中文播客脚本,然后用 TTS 生成音频」 —— 多工具串联
- 「在 ~/projects 里找出近 7 天修改过的文件,生成一份变更报告」 —— 考 shell + 分析
下一篇
CLI 玩熟了,下一篇把他从终端里补出来——接入 Telegram / Discord / Slack,从手机上跟他说话。
本系列文章持续更新,下篇见。
- 作者:Vemperor
- 链接:https://tangly1024.com/article/hermes-03-cli-basics
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。


