侧边栏壁纸
博主头像
硅基核心 (Silicon Core)

行动起来,活在当下

  • 累计撰写 50 篇文章
  • 累计创建 1 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

真正的“零成本”AI 助理:Hermes Agent + Gemma 4 本地部署实战,微信全自动托管教程

jackyezhang
2026-04-29 / 0 评论 / 1 点赞 / 70 阅读 / 0 字
温馨提示:
本文最后更新于2026-04-27,若内容或图片失效,请留言反馈。 部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

引言:告别 API 账单,拿回你的“AI 主权”

在 2026 年,如果你还在为 OpenAI 的 API 额度焦虑,或者担心云端 Agent 泄露隐私,那么这套 “Hermes + Gemma 4 + Ollama” 的组合绝对是目前的终极方案。

这套架构的核心优势只有四个字:完全免费。我们利用本地的 Gemma 4 提供大脑,用 Hermes Agent 实现调度,最后通过 微信 实现远程交互。无需 Token,无需魔法,数据不出本地。


一、 架构拆解:你的私人 AI 实验室

  • 模型层 (Ollama + Gemma 4): 提供底层的推理能力。

  • 核心层 (Hermes Agent): 负责任务拆解与“长记忆”管理。

  • 交互层 (Hermes WebUI): 可视化监控与配置。

  • 连接层 (WeChat): 将 AI 触达真实社交场景。


二、 第一步:构建本地心脏(Ollama + Gemma 4)

首先,通过 Ollama 快速拉取谷歌最强开源模型。

  1. 安装 Ollama: 访问官网下载并运行。

  2. 拉取模型:

    Bash

    ollama run gemma4
    

    (博主 Tip:如果你有 24G 显存,强烈建议拉取 31B 版本,逻辑能力有质变。)

  3. 关键步骤:获取局域网 API 地址 Hermes 运行在 WSL2 环境中,访问 Windows 宿主机不能直接用 127.0.0.1

    • 在 CMD 输入 ipconfig,找到你的 IPv4 地址(如 192.168.1.228)。

    • 你的本地 API Endpoint 为:http://192.168.1.228:11434/v1


三、 第二步:部署 WSL2 极客环境

Hermes 官方对 Linux 的支持最完美,我们选择 WSL2 + Ubuntu

  1. 安装新式终端: 建议先装 Windows Terminal,方便在 PowerShell 和 Ubuntu 间横跳。

  2. 开启 WSL2:

    PowerShell

    wsl --install
    wsl --install -d Ubuntu
    

    (重启电脑,确保 wsl --version 显示为版本 2。)


四、 第三步:Hermes Agent & WebUI 部署

进入 Ubuntu 终端,开始暴力输出:

  1. 安装 Hermes 核心:

    Bash

    curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
    hermes doctor # 检查环境
    
  2. 安装可视化 WebUI:

    Bash

    git clone https://github.com/nesquena/hermes-webui.git
    cd hermes-webui
    ./start.sh
    

    启动后访问 http://127.0.0.1:8787 即可看到 UI 界面。


五、 第四步:配置“OpenAI 兼容”接口

运行 hermes setup 进行配置:

  • Model Provider: 选择 OpenAI Compatible

  • Base URL: 填入刚才获取的局域网 IP http://192.168.1.228:11434/v1

  • Model Name: gemma4

  • Context Length: 建议手动设为 8192 或更高,防止长对话报错。


六、 终极玩法:对接微信 (WeChat)

这是最激动人心的部分,让你的 AI 走出终端。

  1. 执行 hermes setup

  2. 进入 Messaging Platforms -> 选择 WeChat/Weixin

  3. 终端会显示一个二维码,掏出手机扫码登录。 (注意:建议使用微信小号,避免主号频繁触发协议检测。)

完成效果: 现在,你可以给你的微信发消息:“帮我写一段 Python 爬虫脚本”,本地的 Gemma 4 会立即生成代码,通过 Hermes Agent 整理后发送到你的微信手机端。


七、 避坑指南(博主实测记录)

  • 网络阻断: 如果 WSL2 连不上宿主机的 Ollama,请检查 Windows 防火墙,放行 11434 端口。

  • 上下文报错: context window too small 意味着你提的问题太长。在配置文件里把 context_length 拉大,或者重启 Ollama 释放显存。

  • 微信掉线: 网页版微信协议不稳定,保持服务器 24 小时运行并减少重启频率是关键。


总结:

这套方案的意义不仅在于“免费”,更在于“完全自主”。你不再是 AI 的“租客”,而是“房东”。随着 Gemma 4 这种级别的模型不断开源,个人拥有一个全能的私有 AI 助手已不再是梦想。

1
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区