Lazy loaded image
🏇Hermes Agent 教学 03 | 基础使用:CLI 交互与第一个任务
字数 1147阅读时长 3 分钟
2026-4-16
本文是 Hermes Agent 教学系列 第 03 篇。上一篇装上了,这一篇跟它说上话,跟它干点东西。

启动 CLI

会进入交互式会话。你会看到类似这样的提示符:
> 后面直接输你想说的话就行。Hermes 会边思考边调用工具,过程都能看到。

几个高频命令

请注意:以 / 开头的是 CLI 内置命令(跟模型无关),不用 / 的是你跟模型说的话。
命令
用途
/help
罗列所有可用命令
/clear
清空当前会话上下文(但记忆不丢)
/history
查看近期会话
/skills
列出现有 skills
/memory search <关键词>
在记忆里检索
/model
查看或临时切换模型
/exit 或 Ctrl+D
退出
特别说一下 /clear/exit 的区别:
  • /clear 只是重置当前轮上下文,记忆库里的东西还在
  • /exit 退出进程,下次 hermes 启动它还记得之前的事情(这是跟 ChatGPT 本质不同的点)

40+ 内置工具都有什么

不用你手动开,装完就都在。按类别列:
网络与信息
  • web_search —— 调用搜索引擎
  • web_fetch —— 拉取完整页面内容
  • browser —— 启动带状态的浏览器(能点击、填表、截图)
  • vision —— 看图理解
文件与开发
  • read_file / write_file / edit_file
  • run_shell —— 执行 shell 命令(默认需要授权)
  • python —— 运行任意 Python 脚本
  • git —— 仓库操作
生成与输出
  • image_gen —— 生成图像
  • tts —— 文本转语音
  • speech_to_text
Hermes 自身控制
  • memory —— 读写记忆
  • skill —— 创建/调用 skill
  • schedule —— 添加定时任务
  • delegate —— 派发子 agent
完整列表在 /help tools。重点:大多数场景你不需要记这些工具名,直接用自然语言描述任务,Hermes 自己会选。

走一个真实任务

不说虚的,上个例子。任务:「去 GitHub 拉 NousResearch/hermes-agent 这个仓库的 README,帮我翻译成中文并结构化为个人笔记」
你会看到 Hermes 输出类似:
几个值得看的细节:
  1. 思考过程透明 —— Hermes 会告诉你它打算用哪个工具、为什么,不是黑盒子
  1. 主动取舍 —— 该一次拉完的东西不会拆成十次凑 token,该调工具的不会偏要凭记忆胡余
  1. 输出落到磁盘 —— write_file 会产生一个实际文件,不是隐藏在会话里的文本

权限控制

默认配置下,Hermes 在执行以下动作前会问你:
  • 运行任意 shell 命令
  • 写入或修改文件
  • 访问记忆库(某些敏感操作)
  • 调用付费的外部服务
如果你讨厌反复确认(我是),可以:
建议:刚上手别开 dangerously,先用着看 Hermes 会干什么心里有数了再开。它是自主 agent,不给边界会看到一些意想不到的动作。

试试这几个入门任务

装完后推荐跑过一遍,你会对 Hermes 的能力边界有个加减法:
  1. 「总结下今天 Hacker News 首页前 10 条,按领域分类」 —— 考 web_search + 合成
  1. 「看这张 PNG 截图,告诉我里面是什么 UI 问题」 —— 考 vision
  1. 「拉 OpenAI 最新的 blog post,生成一个中文播客脚本,然后用 TTS 生成音频」 —— 多工具串联
  1. 「在 ~/projects 里找出近 7 天修改过的文件,生成一份变更报告」 —— 考 shell + 分析

下一篇

CLI 玩熟了,下一篇把他从终端里补出来——接入 Telegram / Discord / Slack,从手机上跟他说话。

本系列文章持续更新,下篇见。
上一篇
Hermes Agent 教学 04 | 接入消息平台:Telegram / Discord / Slack 与更多
下一篇
Hermes Agent 教学 02 | 从零安装与初次配置