最近 GitHub 上各种 Agent 框架满天飞,老实说我已经有点审美疲劳了。大部分框架给你的就是一堆 API 零件,折腾半天环境,最后弄出来个只能按部就班执行固定 Prompt 的“智障助理”。
直到这两天,我深挖了一下 Hermes Agent 这个项目(目前 74.5k+ Stars),感觉头皮发麻。
这玩意儿根本不是个框架,它是一个开箱即用、全天候挂机、带真实记忆闭环的 Daemon 进程。
如果你手里有台吃灰的 VPS,或者你平时习惯用 CLI 和 Telegram 办公,这东西绝对值得你花十分钟了解一下。我总结了几个让我直呼卧槽的特性,大家品一品:
1. 终于有个长脑子的“记忆闭环”了现在的 Agent 动不动就吹记忆,其实就是简单的 RAG 加上向量库。Hermes 狠的地方在于它真能自己写 Skill。 它会用 LLM 自动总结你跨会话的历史记录,提取经验生成具体的 Skill,下次遇到类似问题直接调用自我改进。配合 Honcho 做深度用户建模,你调教得越久,它就越像一个真正懂你业务流的赛博搭档。
2. 无缝切换底层模型(API 玩家狂喜)
这点对咱们手里攥着一堆中转 API Key 的人来说太友好了。 它完全不绑定任何模型。想用逆向的 Claude 4.6?中转站:https://kirouter.com/ 切!想接你自己的 OpenRouter/GLM/Kimi 甚至本地部署的 Ollama 节点?一句话 hermes model xxx 直接热切换,代码一行不用改。 数据、记忆、Skill 都在你本地的数据库里,外面的大模型对它来说只是个随时可插拔的“外包算力”。今天谁家的 API 便宜且聪明,就切给谁。
它的 UI 简直长在 Linux 玩家的审美上。 内置了一个功能极度完整的 TUI(终端用户界面),支持斜杠命令补全、多行编辑、流式输出、中断重定向。在终端里敲代码敲累了,直接唤出界面让它帮你干活,这沉浸感比 WebUI 强太多了。 不仅如此,起一个 Gateway 进程,它就能同时挂在 Telegram、Discord、Slack 上。你在地铁上用 TG 丢个语音备忘录给它,它在你的云端 VM 上跑完脚本,结果直接推送到你的 Discord 里,上下文完全贯通。
4. NLP 驱动的 Cron 与并行并发- 真·无人值守: 内置了自然语言解析的 cron 调度器。不用去写恶心的 crontab 表达式,直接告诉它:“每天早上 9 点去抓一下昨天的服务器日志,总结一份报告发我 TG”,它就成了。
- 并发处理: 它可以自动 Fork 出隔离的子代理(Sub-agents)去跑并行工作流。通过 RPC 调用工具,把多步杂活(比如一边查邮件、一边跑 Python 脚本抓数据)同时扔进后台并发执行,最后主进程给你汇总。
后端支持极其丰富:本地、Docker、SSH 就不说了。 它支持 Daytona 和 Modal 这种无服务器(Serverless)持久化。这意味着什么?意味着空闲时休眠,0 占用 0 计费,用的时候瞬间唤醒。 你随便丢在一台 $5 的低配小鸡上,或者拿个废旧安卓手机跑 Termux 都能完美承载。
最后说两句:
这项目是 MIT 协议开源的。我们一直想要的,不就是这样一个数据 100% 攥在自己手里、能力跟着我们一起成长、24 小时在线且不需要重度运维的“数字牛马”吗?
不知道坛子里有没有老哥已经深度部署过这个项目的? 我目前还在摸索它的子代理并发极限,大家平时如果用类似的项目(比如 OpenDevin、AutoGPT),都是用来跑什么自动化工作流的?欢迎在下面交流探讨!
8 个帖子 - 8 位参与者