我对Hermes Agent这个项目的态度经历了一个完整的「听说过→不以为然→真香」的过程。
最早知道它,是在很多AI博主的文章里看到的。推荐文案大同小异,大概就是「开源AI助理」「帮你完成各种任务」「人人都该装一个」这类。当时我内心是没什么波动的,因为之前我玩过桌面端的龙虾——不能说没用,但对我来说帮助确实不大,新鲜劲过了就没怎么打开了。所以我对这一类的产品,心里早就贴了一个标签:听起来很美,用起来也就那样。
所以Hermes我虽然很早就听说过,但从来没认真研究过。
说实话,桌面端那个「龙虾」给我留下的印象太深了——倒不是它不好,功能其实挺全的。但问题在于:我每次要用它,必须先打开电脑、启动应用、等待加载。而且它的回复质量参差不齐,有时候回答得很惊艳,有时候又明显在胡扯。几次下来,新鲜感过了,就再也没打开过了。我对这类产品的预期,基本就停留在了「看起来很美,用起来频率很低」这个阶段。
所以当Hermes被各种博主推荐的时候,我心里想的是:嗯,又一个AI助理,大概也差不多吧。
转折点发生在前两天。当时我在搜VPS相关的选购内容,翻到一篇帖子,里面有人说了一句话:
如果你买一个VPS,尽量买1核1G以上的配置,因为你可以装一个Hermes。后面要做脚本安装、服务器运维什么的,直接跟它说就行了。
这句话当时触动了我。
不是因为它的功能描述有多惊艳——「直接跟它说」这种话我听得太多了。而是因为它的应用场景非常具体:运维服务器。我之前从来没把「AI助理」和「SSH连服务器」这两件事联系在一起。在我的认知里,AI助理是写作辅助、是问答工具、是生活管家,而运维是另一套东西。这一句话等于把我脑子里两条没连上的线给搭上了。
然后我就去试了。
在说Hermes之前,先说说跑它的这台机器。
| 项目 | 参数 |
|---|---|
| 配置 | 2核CPU / 2GB内存 / 20GB SSD |
| 系统 | Ubuntu 24.04 |
| 价格 | 一年不到30美元 |
| 主要用途 | 搭sing-box + 个人博客pmvitamin.com |
| 额外用途 | 跑Hermes Agent |
这台VPS最初买来就是干两件事:科学上网和挂博客。Hermes是「来都来了顺便装一个」的心态装上去的。第一感觉是——命令行一键装完,确实不费什么事。但装完之后,面对一个黑乎乎的终端窗口,说实话有点懵:然后呢?我要用它干啥?
这个「然后呢」的阶段其实持续了一段时间。它不像一个App,打开就知道怎么用。它更像一个「积木盒子」——里面有很多零件,但你需要自己决定搭什么。
这里列一下我实际折腾了哪些东西,给想入坑的朋友一个参考。
Hermes本身不提供AI能力,它需要一个底层大模型来驱动。我配的是DeepSeek的v4-flash版本,作为日常使用的默认模型,偶尔需要深度思考的时候手动切到v4-pro。接入方面,我配置了三个入口:
| 接入方式 | 访问地址 | 我什么时候用 |
|---|---|---|
| 微信(iLink Bot) | 直接发消息 | 日常使用,随手发需求 |
| Web UI | ai.pmvitamin.com | 浏览器看长输出、管理 |
| API Server | 内网8642端口 | 底层通信,平时不直接碰 |
微信是真正的主入口。理由很简单——我平时用微信最多,手机不离手。有什么想法直接发一条消息过去,比打开电脑快得多。这种「低摩擦」的使用方式是它能持续用下来的关键。
这是Hermes最有意思的部分,也是我花时间最多的部分。你可以把它理解为「给AI装插件」——每个技能定义了一套工作流程和规则,让它能在特定场景下干得更好。
目前我一共装了26个技能,其中有我自建的:
| 分类 | 技能名称 | 用途 | 来源 |
|---|---|---|---|
| 写作 | vitamin-style-article-writer | 模仿我的写作风格生成文章 | 自建 |
| 自动化 | daily-ai-brief | 每天9点抓AI资讯推送到微信 | 自建 |
| DevOps | static-web-hosting | Nginx网站搭建和配置 | 官方 |
| DevOps | github-pr-workflow | GitHub PR全流程管理 | 官方 |
| 开发 | test-driven-development | 测试驱动开发流程 | 官方 |
| 开发 | systematic-debugging | 系统化Bug排查 | 官方 |
| 创作 | claude-design | 设计HTML落地页和原型 | 官方 |
| 创作 | excalidraw | 手绘风格图表 | 官方 |
| 研究 | arxiv | 论文搜索和摘要 | 官方 |
| 研究 | youtube-content | YouTube视频转录和总结 | 官方 |
| 生产力 | notion | Notion API操作 | 官方 |
| 社交媒体 | xurl | X/Twitter帖子发布和搜索 | 官方 |
我自建的两个技能是花心思最多的。vitamin-style-article-writer前前后后改了四五次风格指南,终于把我想要的「口语化、场景化、有厚度」的感觉慢慢调出来了。daily-ai-brief是一个每天自动运行的爬虫+AI筛选系统,凌晨定时抓取Reddit、GitHub Trending、V2EX和NodeSeek四个源的热门内容,筛选出最值得看的前几条,早上9点准时推到我微信上。
| 项目 | 内容 |
|---|---|
| 任务名 | daily-ai-brief |
| 运行时间 | 每天UTC 1:00(深圳时间9:00) |
| 数据来源 | Reddit / GitHub / V2EX / NodeSeek |
| 去重策略 | URL去重,热帖最多出现2次,7天清理 |
| 输出格式 | 纯文本,每条约100字推荐理由 |
| 运行状态 | 已稳定运行,没有翻车 |
这个定时任务是我觉得「AI助理」这个定位真正兑现价值的场景。每天早上起来打开微信,已经有一条成型的AI资讯简报在等着了。不需要打开任何App去刷,信息直接送到眼前——这种体验确实比自己去各个平台翻一遍舒服。
配置文件写了484行,大部分是默认值,真正改的其实没几项,列出来供参考:
| 配置项 | 我的设置 | 为什么这么设 |
|---|---|---|
| 默认模型 | deepseek-v4-flash | 速度快、日常够用 |
| 推理深度 | high | 宁可多花点 token,不要敷衍回答 |
| 命令审批 | 关闭 | 受不了每步都问「确认执行?」 |
| 记忆系统 | 开启,2200+1375字符限制 | 让它记住我的写作偏好和配置细节 |
| 上下文压缩 | 开启,阈值50% | 防止长对话 Token 溢出 |
| 最长轮次 | 90 | 复杂任务一次性搞定 |
配置是基础,真正让我觉得「这玩意儿确实有用」的,是实际干出来的这几件事。
pmvitamin.com从域名的迁移到上线到功能修修补补,基本上全是Hermes帮我搞的。
| 做的事情 | 具体内容 |
|---|---|
| Nginx配置 | 反代规则、SSL证书、缓存策略 |
| Cloudflare接入 | CDN加速、SSL模式配置 |
| Vditor编辑器部署 | Markdown编辑器、登录认证、Nginx反代到/editor/ |
| FileBrowser文件管理 | 文件管理、Nginx反代到/admin/ |
| 一体化编辑器IDE | 左侧文件列表 + 右键菜单 + 发布流程 |
| 微信公众号复制 | 一键将文章转为公众号格式 |
说实话,这些事情我以前也不是不能做。但区别在于——以前要自己翻文档、敲命令、碰到报错还要搜半天。现在直接跟Hermes说需求,它给出方案,我确认一下,它执行,遇到问题它会自己排查。效率不是高了一点点,是完全不同的工作方式。
比如那台编辑器先是右键菜单点了没反应,报的是JS的时序问题。在以前,我得打开浏览器开发者工具,一行一行看堆栈,定位到问题再改代码。现在呢?我把报错信息复制给它,说「右键属性没反应」,它自己定位到两个JS错误,给出修复方案。我试了一下,好了。
这种感觉很微妙:好像身边多了一个不用睡觉、不会抱怨的同事。
这个话要说得诚实一点——我不会说「Hermes帮我写了文章」,因为最终拍板的人还是我自己。但它的确帮我做了很多「苦力活」。
| 文章 | 它帮我做了什么 |
|---|---|
| VPS选购指南 | 搜资料、整理对比表格、生成初稿、反复改排版 |
| Hermes对产品经理有用吗 | 打草稿、调结构、补充信息来源 |
| 这篇 | 梳理配置、整理数据、按照我的风格写 |
我最满意的其实是那个写作技能。我花了很多时间跟它描述我想要的风格——不要AI味、要有场景感、要有真实细节、每段不要超过6行但整体要丰富。现在调出来的版本,打出来的草稿虽然还得自己润色,但轮廓已经能看了。这对一个平时写东西的人来说是很有价值的——从空白文档开始是最难的,有个靠谱的初稿,改起来就轻松得多。
这个前面说了。每天早上一条微信,把AI圈的前沿信息直接送到我面前。它让我养成了一个新习惯:早上先看日报再刷别的。
我的两个前端项目——Vita-Design-JXC-Prototype(进销存原型)和vita-pda-deepseek(PDA扫码AI对话)——都配了推送即部署的流水线。代码推到GitHub,自动构建并部署到服务器的对应目录。中间因为Vite的子路径问题还折腾了一下——需要加base:"./"和HashRouter,否则部署出来是白屏。这些坑都是Hermes帮我排查出来的。
查内存占用、看各服务状态、改Nginx配置、配置SSL证书、修缓存策略、排查编辑器Bug——这些都是日常工作流的自然延伸。区别是现在不需要记命令了,直接说就行。
| 做的事 | 以前的方式 | 现在的方式 |
|---|---|---|
| 查内存占用 | 记free -h命令+理解输出 |
「看看我的VPS内存够不够」 |
| 改Nginx配置 | vi编辑+测试+重载 | 「把缓存策略改成no-store」 |
| 排查Bug | 看日志+查资料+试修复 | 贴错误信息→等方案→确认执行 |
| 部署前端 | 手动SSH+git pull+build | 推到GitHub自动完成 |
当然,也不是所有事情都通过它做。复杂的架构设计、需要深度思考的业务分析,我仍然习惯自己来。但「执行层」的事情,已经越来越多地交给它了。
用了这段时间,有一些结论可以说得比较确定了。
这是我自己最关心的一个问题——毕竟2GB内存的机器,跑个sing-box再加个Hermes,会不会卡?
实际测下来:
| 服务 | 日常内存 | 峰值内存 | CPU占用 |
|---|---|---|---|
| Hermes网关 | 366MB | 566MB | 较低 |
| sing-box | 83MB | 123MB | ~0.8% |
| hermes-web-ui | 40MB | 60MB | 接近0% |
| 合计 | ~490MB | ~750MB | 很低 |
2GB的机器,所有服务加起来不到一半。平时闲置时内存占用在500MB上下,还剩1.5GB空闲。结论很明确:低配VPS完全够用。
装确实不难,一行命令就装好了。但「上手」和「用好」之间有不小的距离。
我举个例子你就明白了。装完Hermes的头一个小时,我的体验是这样的:装好了 → 配了DeepSeek的Key → 试探性问了一句「你能干什么」→ 它列了一堆能力 → 我看着这些能力列表 → 然后呢?我该从哪里开始?
这种感觉很像你买了一套宜家家具,打开箱子发现里面几百个零件,说明书倒是给你了,但你得自己决定先装哪个部分。不是装不了,而是面对一个空白状态的时候,需要一些「引导」才能进入状态。
后来我是怎么克服的?也很简单——我就从一件具体的事情开始。我说「帮我看看VPS的内存占用」,它执行了,返回了结果。我说「帮我把Nginx配置改一下」,它执行了,我验证了。干了一两个具体的活之后,整个「这个工具到底能帮我做什么」的图景就慢慢清晰起来了。
| 阶段 | 需要什么 | 大概时间 |
|---|---|---|
| 安装 | 一行命令 | 1分钟 |
| 配置模型和API | 注册API、填Key | 10分钟 |
| 接入微信 | 申请Bot、配置网关 | 半小时 |
| 写第一个skill | 理解skill结构、调试 | 1-2小时 |
| 调出满意的写作风格 | 反复修改指导说明 | 断断续续几天 |
不需要你会写代码——这点是对的。但需要你能说清楚自己要什么。我花在调写作skill上的时间,大部分不是在写代码,而是在想「我到底要什么样的风格」「什么样的句子我满意、什么样的我不满意」。这是一个表达能力的问题,不是技术能力的问题。
说良心话——初稿能用,但不算惊艳。特别是之前的版本,我明显感觉它写得「太简洁了」,每段都是干巴巴的几句话,没有场景没有感受没有细节,读起来像AI写的。所以前段时间我专门更新了写作skill的厚度控制和丰富度检查,把标准文章的字数目标从之前的范围调整到4500-6000字,并加入了6种丰富要素的具体检查。
这次这篇文章就是用的更新后的skill。我自己看下来,比之前丰满了不少。但你要说它能直接替代我写公众号?还差得远。 它能打80分的底稿,剩下20分的润色和调整,得我自己来。
写到这里,我想专门花一节来聊聊那些博主们没说到的东西。
| 自媒体说的 | 我实际体验的 |
|---|---|
| 「一行命令装好」 | 装是简单,但配模型、配微信、调skill,前前后后花了不少时间 |
| 「免费AI助理」 | Hermes本身免费,但VPS要钱、API Key要钱。一个月下来几十块吧,不算贵但也不是零成本 |
| 「人人都该装一个」 | 适合有VPS的人、喜欢研究工具的人。大部分人装了可能用两天就忘了 |
| 「AI帮你完成工作」 | 能辅助,不能替代。 写PRD、画原型、做需求分析——这些事情它帮不了你 |
| 「不学就晚了」 | 贩卖焦虑。产品经理的核心竞争力不是玩工具,是对业务的理解和判断力 |
| 「装上就是个人助理」 | 它的能力取决于你投入多少。你花时间配skill、写风格指南,它就越好用。不动它,它就只是一个命令行聊天界面 |
这句话可能不太讨喜:Hermes是一个上限很高、下限也很低的工具。 你的投入决定了它对你的价值。如果你愿意花时间去理解它的设计逻辑、去配技能、去调风格,它能变成一个很趁手的工具。如果你只是想装上去它就什么都帮你干了——大概率会失望。
这部分我写得很坦然,因为确实还有很多东西没碰。
| 功能/场景 | 状态 | 备注 |
|---|---|---|
| 语音对话(TTS/STT) | 已配置,未实际使用 | Edge TTS配好了,但没找到使用场景 |
| 多Agent并行 | 没试过 | delegate_task子系统没用过 |
| 工作场景(PRD/原型) | 没试过 | 希望有一天能用,但目前还没找到合适的上手方式 |
| MCP服务 | 完全没碰 | 不知道怎么用、有什么用 |
| ComfyUI图片生成 | 没装 | 暂时没有这个需求 |
| Kanban任务队列 | 简单了解,未深入 | 做复杂项目时可能会用到 |
| YouTube内容处理 | 试用过 | 转过几个视频字幕,但没形成工作流 |
坦白说,我现在可能只用了这个工具20%的能力。 它的skill市场有上百个现成技能,我装了26个,深入用过的大概10个不到。语音、图片、多Agent这些高级功能完全还在探索名单上。
但换个角度想——用20%的能力已经解决了上面说的这么多事情,说明这个工具的底子是好的。 剩下的80%不是它不好用,是我还没需要用到那个程度。
我给自己列了一个优先级:先把写作和工作流跑顺,再慢慢探索高级功能。一口吃不成胖子。
接下来如果要试新东西,我会先碰语音——TTS/STT都配好了,试试在开车或者走路的时候跟它聊,看看这个场景是不是真的实用。然后再考虑多Agent能不能帮我把一些重复性的工作批量处理掉。至于MCP和ComfyUI,排在后面,暂时不急。
写这篇文章的初衷很简单:把自己这两天的真实体验记下来,给同样在观望的朋友一个参考。
Hermes不是一个完美的产品,它有很多需要你花时间去学习和配置的地方。自媒体说得天花乱坠的那些话,你信个五成就够了。但在我的体验里,它是一个真实有价值的工具——因为我已经用了它两天,而且还在继续用,而不是装完就扔在那里吃灰。
一台不到30美元一年的VPS,加上一个开源项目,能折腾出这些事情来。对我来说,这已经值回票价了。
你也在用AI助理吗?还是也在观望?欢迎在评论区聊聊你的体验和想法。