引言:告别 API 账单,拿回你的“AI 主权”
在 2026 年,如果你还在为 OpenAI 的 API 额度焦虑,或者担心云端 Agent 泄露隐私,那么这套 “Hermes + Gemma 4 + Ollama” 的组合绝对是目前的终极方案。
这套架构的核心优势只有四个字:完全免费。我们利用本地的 Gemma 4 提供大脑,用 Hermes Agent 实现调度,最后通过 微信 实现远程交互。无需 Token,无需魔法,数据不出本地。
一、 架构拆解:你的私人 AI 实验室
模型层 (Ollama + Gemma 4): 提供底层的推理能力。
核心层 (Hermes Agent): 负责任务拆解与“长记忆”管理。
交互层 (Hermes WebUI): 可视化监控与配置。
连接层 (WeChat): 将 AI 触达真实社交场景。
二、 第一步:构建本地心脏(Ollama + Gemma 4)
首先,通过 Ollama 快速拉取谷歌最强开源模型。
安装 Ollama: 访问官网下载并运行。
拉取模型:
Bash
ollama run gemma4(博主 Tip:如果你有 24G 显存,强烈建议拉取 31B 版本,逻辑能力有质变。)
关键步骤:获取局域网 API 地址 Hermes 运行在 WSL2 环境中,访问 Windows 宿主机不能直接用
127.0.0.1。在 CMD 输入
ipconfig,找到你的 IPv4 地址(如192.168.1.228)。你的本地 API Endpoint 为:
http://192.168.1.228:11434/v1。
三、 第二步:部署 WSL2 极客环境
Hermes 官方对 Linux 的支持最完美,我们选择 WSL2 + Ubuntu。
安装新式终端: 建议先装 Windows Terminal,方便在 PowerShell 和 Ubuntu 间横跳。
开启 WSL2:
PowerShell
wsl --install wsl --install -d Ubuntu(重启电脑,确保
wsl --version显示为版本 2。)
四、 第三步:Hermes Agent & WebUI 部署
进入 Ubuntu 终端,开始暴力输出:
安装 Hermes 核心:
Bash
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash hermes doctor # 检查环境安装可视化 WebUI:
Bash
git clone https://github.com/nesquena/hermes-webui.git cd hermes-webui ./start.sh启动后访问
http://127.0.0.1:8787即可看到 UI 界面。
五、 第四步:配置“OpenAI 兼容”接口
运行 hermes setup 进行配置:
Model Provider: 选择
OpenAI Compatible。Base URL: 填入刚才获取的局域网 IP
http://192.168.1.228:11434/v1。Model Name:
gemma4。Context Length: 建议手动设为
8192或更高,防止长对话报错。
六、 终极玩法:对接微信 (WeChat)
这是最激动人心的部分,让你的 AI 走出终端。
执行
hermes setup。进入 Messaging Platforms -> 选择 WeChat/Weixin。
终端会显示一个二维码,掏出手机扫码登录。 (注意:建议使用微信小号,避免主号频繁触发协议检测。)
完成效果: 现在,你可以给你的微信发消息:“帮我写一段 Python 爬虫脚本”,本地的 Gemma 4 会立即生成代码,通过 Hermes Agent 整理后发送到你的微信手机端。
七、 避坑指南(博主实测记录)
网络阻断: 如果 WSL2 连不上宿主机的 Ollama,请检查 Windows 防火墙,放行
11434端口。上下文报错:
context window too small意味着你提的问题太长。在配置文件里把context_length拉大,或者重启 Ollama 释放显存。微信掉线: 网页版微信协议不稳定,保持服务器 24 小时运行并减少重启频率是关键。
总结:
这套方案的意义不仅在于“免费”,更在于“完全自主”。你不再是 AI 的“租客”,而是“房东”。随着 Gemma 4 这种级别的模型不断开源,个人拥有一个全能的私有 AI 助手已不再是梦想。
评论区