功能概览
Hermes Agent 拥有一系列丰富的功能,远超基础聊天能力。从持久化记忆和文件感知上下文,到浏览器自动化和语音对话,这些功能协同工作,使 Hermes 成为一个强大的自主助手。
核心功能
- 工具与工具集 — 工具是扩展代理能力的函数。它们被组织成逻辑上的工具集,可按平台启用或禁用,涵盖网络搜索、终端执行、文件编辑、记忆管理、任务委派等。
- 技能系统 — 按需加载的知识文档,代理在需要时可调用。技能遵循渐进式披露模式,以最小化 token 使用量,并兼容 agentskills.io 开放标准。
- 持久化记忆 — 有界且经过筛选的记忆,可在会话间持久保留。Hermes 会记住你的偏好、项目、环境以及通过
MEMORY.md和USER.md学习到的内容。 - 上下文文件 — Hermes 会自动发现并加载项目上下文文件(
.hermes.md、AGENTS.md、CLAUDE.md、SOUL.md、.cursorrules),以定义其在项目中的行为方式。 - 上下文引用 — 输入
@后跟引用,可将文件、文件夹、git 差异和 URL 直接注入消息中。Hermes 会内联展开引用并自动附加内容。 - 检查点 — Hermes 在修改文件前会自动对工作目录进行快照,若出现问题,可通过
/rollback命令安全回滚。
自动化功能
- 定时任务(Cron) — 使用自然语言或 Cron 表达式安排任务自动运行。任务可附加技能,将结果发送至任意平台,并支持暂停、恢复和编辑操作。
- 子代理委派 —
delegate_task工具会生成具有隔离上下文、受限工具集和独立终端会话的子代理实例。最多可并行运行 3 个子代理,处理多个并行工作流。 - 代码执行 —
execute_code工具允许代理编写 Python 脚本,以程序化方式调用 Hermes 工具,通过沙箱化的 RPC 执行,将多步骤工作流压缩为单次 LLM 调用。 - 事件钩子 — 在关键生命周期节点运行自定义代码。网关钩子处理日志记录、告警和 Webhook;插件钩子处理工具拦截、指标统计和安全防护。
- 批量处理 — 在数百甚至数千个提示上并行运行 Hermes 代理,生成结构化的 ShareGPT 格式轨迹数据,用于训练数据生成或评估。
媒体与网络功能
-
语音模式 — 支持 CLI 和消息平台的完整语音交互。通过麦克风与代理对话,听取语音回复,并在 Discord 语音频道中进行实时语音交流。
-
浏览器自动化 — 支持多种后端的完整浏览器自动化:Browserbase 云服务、Browser Use 云服务、本地 Chrome(通过 CDP)或本地 Chromium。可导航网站、填写表单并提取信息。
-
视觉与图像粘贴 — 多模态视觉支持。可将剪贴板中的图像粘贴到 CLI 中,让代理使用任何具备视觉能力的模型对其进行分析、描述或处理。
-
图像生成 — 使用 FAL.ai 的 FLUX 2 Pro 模型,根据文本提示生成图像,并通过 Clarity Upscaler 实现自动 2 倍超分辨率。
-
语音与 TTS — 所有消息平台均支持文本转语音输出和语音消息转录,提供五种服务提供商选择:Edge TTS(免费)、ElevenLabs、OpenAI TTS、MiniMax 和 NeuTTS。
-
MCP 集成 — 通过标准输入/输出或 HTTP 传输连接任意 MCP 服务器。无需编写原生 Hermes 工具,即可访问来自 GitHub、数据库、文件系统和内部 API 的外部工具。支持按服务器的工具过滤和采样功能。
-
提供者路由 — 对哪些 AI 提供者处理您的请求实现细粒度控制。通过排序、白名单、黑名单和优先级排序,优化成本、速度或质量。
-
备用提供者 — 当主模型出现错误时,自动切换到备用的大语言模型提供者,包括对视觉、压缩等辅助任务的独立故障转移。
-
凭证池 — 将同一提供者的 API 调用分发到多个密钥上。在遇到速率限制或失败时自动轮换密钥。
-
记忆提供者 — 集成外部记忆后端(Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover),实现跨会话的用户建模与个性化,超越内置的记忆系统。
-
API 服务器 — 将 Hermes 暴露为兼容 OpenAI 的 HTTP 端点。可连接任何支持 OpenAI 格式的前端工具——Open WebUI、LobeChat、LibreChat 等。
-
IDE 集成(ACP) — 在支持 ACP 的编辑器(如 VS Code、Zed 和 JetBrains)中使用 Hermes。聊天、工具活动、文件差异和终端命令将直接渲染在您的编辑器内。
-
强化学习训练 — 从代理会话中生成轨迹数据,用于强化学习和模型微调。
自定义功能
- 个性与 SOUL.md — 完全可自定义的代理个性。
SOUL.md是主要身份文件——系统提示中的第一部分——您可以在每个会话中切换内置或自定义的/personality预设。 - 皮肤与主题 — 自定义 CLI 的视觉呈现:横幅颜色、进度条表情和动词、响应框标签、品牌文本以及工具活动前缀。
- 插件 — 无需修改核心代码即可添加自定义工具、钩子和集成。三种插件类型:通用插件(工具/钩子)、记忆提供者(跨会话知识)和上下文引擎(替代上下文管理)。通过统一的
hermes plugins交互式 UI 进行管理。