← 返回文章列表

一台2GB VPS上的Hermes Agent:我配置了什么,验证了什么,还有哪些没搞明白

2026-05-11 HermesVPSAIAgent产品经理AI工具开源

我对Hermes Agent这个项目的态度经历了一个完整的「听说过→不以为然→真香」的过程。

最早知道它,是在很多AI博主的文章里看到的。推荐文案大同小异,大概就是「开源AI助理」「帮你完成各种任务」「人人都该装一个」这类。当时我内心是没什么波动的,因为之前我玩过桌面端的龙虾——不能说没用,但对我来说帮助确实不大,新鲜劲过了就没怎么打开了。所以我对这一类的产品,心里早就贴了一个标签:听起来很美,用起来也就那样

所以Hermes我虽然很早就听说过,但从来没认真研究过。

说实话,桌面端那个「龙虾」给我留下的印象太深了——倒不是它不好,功能其实挺全的。但问题在于:我每次要用它,必须先打开电脑、启动应用、等待加载。而且它的回复质量参差不齐,有时候回答得很惊艳,有时候又明显在胡扯。几次下来,新鲜感过了,就再也没打开过了。我对这类产品的预期,基本就停留在了「看起来很美,用起来频率很低」这个阶段。

所以当Hermes被各种博主推荐的时候,我心里想的是:嗯,又一个AI助理,大概也差不多吧。

转折点发生在前两天。当时我在搜VPS相关的选购内容,翻到一篇帖子,里面有人说了一句话:

如果你买一个VPS,尽量买1核1G以上的配置,因为你可以装一个Hermes。后面要做脚本安装、服务器运维什么的,直接跟它说就行了。

这句话当时触动了我。

不是因为它的功能描述有多惊艳——「直接跟它说」这种话我听得太多了。而是因为它的应用场景非常具体:运维服务器。我之前从来没把「AI助理」和「SSH连服务器」这两件事联系在一起。在我的认知里,AI助理是写作辅助、是问答工具、是生活管家,而运维是另一套东西。这一句话等于把我脑子里两条没连上的线给搭上了。

然后我就去试了。


先交代一下这台VPS

在说Hermes之前,先说说跑它的这台机器。

项目 参数
配置 2核CPU / 2GB内存 / 20GB SSD
系统 Ubuntu 24.04
价格 一年不到30美元
主要用途 搭sing-box + 个人博客pmvitamin.com
额外用途 跑Hermes Agent

这台VPS最初买来就是干两件事:科学上网和挂博客。Hermes是「来都来了顺便装一个」的心态装上去的。第一感觉是——命令行一键装完,确实不费什么事。但装完之后,面对一个黑乎乎的终端窗口,说实话有点懵:然后呢?我要用它干啥?

这个「然后呢」的阶段其实持续了一段时间。它不像一个App,打开就知道怎么用。它更像一个「积木盒子」——里面有很多零件,但你需要自己决定搭什么。


我到底配置了什么东西?

这里列一下我实际折腾了哪些东西,给想入坑的朋友一个参考。

模型和接入方式

Hermes本身不提供AI能力,它需要一个底层大模型来驱动。我配的是DeepSeek的v4-flash版本,作为日常使用的默认模型,偶尔需要深度思考的时候手动切到v4-pro。接入方面,我配置了三个入口:

接入方式 访问地址 我什么时候用
微信(iLink Bot) 直接发消息 日常使用,随手发需求
Web UI ai.pmvitamin.com 浏览器看长输出、管理
API Server 内网8642端口 底层通信,平时不直接碰

微信是真正的主入口。理由很简单——我平时用微信最多,手机不离手。有什么想法直接发一条消息过去,比打开电脑快得多。这种「低摩擦」的使用方式是它能持续用下来的关键。

技能系统

这是Hermes最有意思的部分,也是我花时间最多的部分。你可以把它理解为「给AI装插件」——每个技能定义了一套工作流程和规则,让它能在特定场景下干得更好。

目前我一共装了26个技能,其中有我自建的:

分类 技能名称 用途 来源
写作 vitamin-style-article-writer 模仿我的写作风格生成文章 自建
自动化 daily-ai-brief 每天9点抓AI资讯推送到微信 自建
DevOps static-web-hosting Nginx网站搭建和配置 官方
DevOps github-pr-workflow GitHub PR全流程管理 官方
开发 test-driven-development 测试驱动开发流程 官方
开发 systematic-debugging 系统化Bug排查 官方
创作 claude-design 设计HTML落地页和原型 官方
创作 excalidraw 手绘风格图表 官方
研究 arxiv 论文搜索和摘要 官方
研究 youtube-content YouTube视频转录和总结 官方
生产力 notion Notion API操作 官方
社交媒体 xurl X/Twitter帖子发布和搜索 官方

我自建的两个技能是花心思最多的。vitamin-style-article-writer前前后后改了四五次风格指南,终于把我想要的「口语化、场景化、有厚度」的感觉慢慢调出来了。daily-ai-brief是一个每天自动运行的爬虫+AI筛选系统,凌晨定时抓取Reddit、GitHub Trending、V2EX和NodeSeek四个源的热门内容,筛选出最值得看的前几条,早上9点准时推到我微信上。

自动化:一个定时任务

项目 内容
任务名 daily-ai-brief
运行时间 每天UTC 1:00(深圳时间9:00)
数据来源 Reddit / GitHub / V2EX / NodeSeek
去重策略 URL去重,热帖最多出现2次,7天清理
输出格式 纯文本,每条约100字推荐理由
运行状态 已稳定运行,没有翻车

这个定时任务是我觉得「AI助理」这个定位真正兑现价值的场景。每天早上起来打开微信,已经有一条成型的AI资讯简报在等着了。不需要打开任何App去刷,信息直接送到眼前——这种体验确实比自己去各个平台翻一遍舒服。

配置细节一览

配置文件写了484行,大部分是默认值,真正改的其实没几项,列出来供参考:

配置项 我的设置 为什么这么设
默认模型 deepseek-v4-flash 速度快、日常够用
推理深度 high 宁可多花点 token,不要敷衍回答
命令审批 关闭 受不了每步都问「确认执行?」
记忆系统 开启,2200+1375字符限制 让它记住我的写作偏好和配置细节
上下文压缩 开启,阈值50% 防止长对话 Token 溢出
最长轮次 90 复杂任务一次性搞定

我用Hermes做了哪些事?

配置是基础,真正让我觉得「这玩意儿确实有用」的,是实际干出来的这几件事。

1. 搭了一个完整的技术博客

pmvitamin.com从域名的迁移到上线到功能修修补补,基本上全是Hermes帮我搞的。

做的事情 具体内容
Nginx配置 反代规则、SSL证书、缓存策略
Cloudflare接入 CDN加速、SSL模式配置
Vditor编辑器部署 Markdown编辑器、登录认证、Nginx反代到/editor/
FileBrowser文件管理 文件管理、Nginx反代到/admin/
一体化编辑器IDE 左侧文件列表 + 右键菜单 + 发布流程
微信公众号复制 一键将文章转为公众号格式

说实话,这些事情我以前也不是不能做。但区别在于——以前要自己翻文档、敲命令、碰到报错还要搜半天。现在直接跟Hermes说需求,它给出方案,我确认一下,它执行,遇到问题它会自己排查。效率不是高了一点点,是完全不同的工作方式

比如那台编辑器先是右键菜单点了没反应,报的是JS的时序问题。在以前,我得打开浏览器开发者工具,一行一行看堆栈,定位到问题再改代码。现在呢?我把报错信息复制给它,说「右键属性没反应」,它自己定位到两个JS错误,给出修复方案。我试了一下,好了。

这种感觉很微妙:好像身边多了一个不用睡觉、不会抱怨的同事。

2. 写了几篇文章

这个话要说得诚实一点——我不会说「Hermes帮我写了文章」,因为最终拍板的人还是我自己。但它的确帮我做了很多「苦力活」。

文章 它帮我做了什么
VPS选购指南 搜资料、整理对比表格、生成初稿、反复改排版
Hermes对产品经理有用吗 打草稿、调结构、补充信息来源
这篇 梳理配置、整理数据、按照我的风格写

我最满意的其实是那个写作技能。我花了很多时间跟它描述我想要的风格——不要AI味、要有场景感、要有真实细节、每段不要超过6行但整体要丰富。现在调出来的版本,打出来的草稿虽然还得自己润色,但轮廓已经能看了。这对一个平时写东西的人来说是很有价值的——从空白文档开始是最难的,有个靠谱的初稿,改起来就轻松得多。

3. 建了一个AI日报系统

这个前面说了。每天早上一条微信,把AI圈的前沿信息直接送到我面前。它让我养成了一个新习惯:早上先看日报再刷别的。

4. 配了两套GitHub Actions自动部署

我的两个前端项目——Vita-Design-JXC-Prototype(进销存原型)和vita-pda-deepseek(PDA扫码AI对话)——都配了推送即部署的流水线。代码推到GitHub,自动构建并部署到服务器的对应目录。中间因为Vite的子路径问题还折腾了一下——需要加base:"./"和HashRouter,否则部署出来是白屏。这些坑都是Hermes帮我排查出来的。

5. 日常服务器运维

查内存占用、看各服务状态、改Nginx配置、配置SSL证书、修缓存策略、排查编辑器Bug——这些都是日常工作流的自然延伸。区别是现在不需要记命令了,直接说就行。

做的事 以前的方式 现在的方式
查内存占用 free -h命令+理解输出 「看看我的VPS内存够不够」
改Nginx配置 vi编辑+测试+重载 「把缓存策略改成no-store」
排查Bug 看日志+查资料+试修复 贴错误信息→等方案→确认执行
部署前端 手动SSH+git pull+build 推到GitHub自动完成

当然,也不是所有事情都通过它做。复杂的架构设计、需要深度思考的业务分析,我仍然习惯自己来。但「执行层」的事情,已经越来越多地交给它了。


验证了什么?

用了这段时间,有一些结论可以说得比较确定了。

VPS能带动吗?完全OK

这是我自己最关心的一个问题——毕竟2GB内存的机器,跑个sing-box再加个Hermes,会不会卡?

实际测下来:

服务 日常内存 峰值内存 CPU占用
Hermes网关 366MB 566MB 较低
sing-box 83MB 123MB ~0.8%
hermes-web-ui 40MB 60MB 接近0%
合计 ~490MB ~750MB 很低

2GB的机器,所有服务加起来不到一半。平时闲置时内存占用在500MB上下,还剩1.5GB空闲。结论很明确:低配VPS完全够用。

门槛高吗?看你怎么理解「门槛」

装确实不难,一行命令就装好了。但「上手」和「用好」之间有不小的距离。

我举个例子你就明白了。装完Hermes的头一个小时,我的体验是这样的:装好了 → 配了DeepSeek的Key → 试探性问了一句「你能干什么」→ 它列了一堆能力 → 我看着这些能力列表 → 然后呢?我该从哪里开始?

这种感觉很像你买了一套宜家家具,打开箱子发现里面几百个零件,说明书倒是给你了,但你得自己决定先装哪个部分。不是装不了,而是面对一个空白状态的时候,需要一些「引导」才能进入状态。

后来我是怎么克服的?也很简单——我就从一件具体的事情开始。我说「帮我看看VPS的内存占用」,它执行了,返回了结果。我说「帮我把Nginx配置改一下」,它执行了,我验证了。干了一两个具体的活之后,整个「这个工具到底能帮我做什么」的图景就慢慢清晰起来了。

阶段 需要什么 大概时间
安装 一行命令 1分钟
配置模型和API 注册API、填Key 10分钟
接入微信 申请Bot、配置网关 半小时
写第一个skill 理解skill结构、调试 1-2小时
调出满意的写作风格 反复修改指导说明 断断续续几天

不需要你会写代码——这点是对的。但需要你能说清楚自己要什么。我花在调写作skill上的时间,大部分不是在写代码,而是在想「我到底要什么样的风格」「什么样的句子我满意、什么样的我不满意」。这是一个表达能力的问题,不是技术能力的问题。

写文章的水平到底怎么样?

说良心话——初稿能用,但不算惊艳。特别是之前的版本,我明显感觉它写得「太简洁了」,每段都是干巴巴的几句话,没有场景没有感受没有细节,读起来像AI写的。所以前段时间我专门更新了写作skill的厚度控制和丰富度检查,把标准文章的字数目标从之前的范围调整到4500-6000字,并加入了6种丰富要素的具体检查。

这次这篇文章就是用的更新后的skill。我自己看下来,比之前丰满了不少。但你要说它能直接替代我写公众号?还差得远。 它能打80分的底稿,剩下20分的润色和调整,得我自己来。


哪里被自媒体带偏了?

写到这里,我想专门花一节来聊聊那些博主们没说到的东西。

自媒体说的 我实际体验的
「一行命令装好」 装是简单,但配模型、配微信、调skill,前前后后花了不少时间
「免费AI助理」 Hermes本身免费,但VPS要钱、API Key要钱。一个月下来几十块吧,不算贵但也不是零成本
「人人都该装一个」 适合有VPS的人、喜欢研究工具的人。大部分人装了可能用两天就忘了
「AI帮你完成工作」 能辅助,不能替代。 写PRD、画原型、做需求分析——这些事情它帮不了你
「不学就晚了」 贩卖焦虑。产品经理的核心竞争力不是玩工具,是对业务的理解和判断力
「装上就是个人助理」 它的能力取决于你投入多少。你花时间配skill、写风格指南,它就越好用。不动它,它就只是一个命令行聊天界面

这句话可能不太讨喜:Hermes是一个上限很高、下限也很低的工具。 你的投入决定了它对你的价值。如果你愿意花时间去理解它的设计逻辑、去配技能、去调风格,它能变成一个很趁手的工具。如果你只是想装上去它就什么都帮你干了——大概率会失望。


还有哪些没验证?

这部分我写得很坦然,因为确实还有很多东西没碰。

功能/场景 状态 备注
语音对话(TTS/STT) 已配置,未实际使用 Edge TTS配好了,但没找到使用场景
多Agent并行 没试过 delegate_task子系统没用过
工作场景(PRD/原型) 没试过 希望有一天能用,但目前还没找到合适的上手方式
MCP服务 完全没碰 不知道怎么用、有什么用
ComfyUI图片生成 没装 暂时没有这个需求
Kanban任务队列 简单了解,未深入 做复杂项目时可能会用到
YouTube内容处理 试用过 转过几个视频字幕,但没形成工作流

坦白说,我现在可能只用了这个工具20%的能力。 它的skill市场有上百个现成技能,我装了26个,深入用过的大概10个不到。语音、图片、多Agent这些高级功能完全还在探索名单上。

但换个角度想——用20%的能力已经解决了上面说的这么多事情,说明这个工具的底子是好的。 剩下的80%不是它不好用,是我还没需要用到那个程度。

我给自己列了一个优先级:先把写作和工作流跑顺,再慢慢探索高级功能。一口吃不成胖子。

接下来如果要试新东西,我会先碰语音——TTS/STT都配好了,试试在开车或者走路的时候跟它聊,看看这个场景是不是真的实用。然后再考虑多Agent能不能帮我把一些重复性的工作批量处理掉。至于MCP和ComfyUI,排在后面,暂时不急。


写这篇文章的初衷很简单:把自己这两天的真实体验记下来,给同样在观望的朋友一个参考。

Hermes不是一个完美的产品,它有很多需要你花时间去学习和配置的地方。自媒体说得天花乱坠的那些话,你信个五成就够了。但在我的体验里,它是一个真实有价值的工具——因为我已经用了它两天,而且还在继续用,而不是装完就扔在那里吃灰。

一台不到30美元一年的VPS,加上一个开源项目,能折腾出这些事情来。对我来说,这已经值回票价了。

你也在用AI助理吗?还是也在观望?欢迎在评论区聊聊你的体验和想法。