教你用 Ollama 本地部署谷歌 Gemma 4并接入 OpenClaw

4月2日-谷歌 Gemma 4 深夜突袭！31B 模型击败大 20 倍对手，教你用 Ollama 本地部署并接入 OpenClaw

一、为什么 Gemma 4 值得关注？

1.1 发布背景

4月2日凌晨，谷歌毫无预兆地发布了 Gemma 4 系列模型：

4B：手机都能跑的轻量版
12B：平衡性能与速度
27B：对标 GPT-4 级别

1.2 核心亮点

特性	Gemma 4 27B	Llama 3 70B	GPT-4
参数	27B	70B	未知
上下文	128K	8K	128K
MMLU 得分	85.6	82.0	86.4
开源	✅	✅	❌

关键点：

用 27B 打赢 70B，效率革命
128K 上下文，长文档处理无压力
完全开源，可商用

1.3 与 OpenClaw 的关系

OpenClaw 支持多种模型后端，Gemma 4 可以：

作为本地模型替代 API 调用
保护隐私数据不出本机
零成本使用（无 API 费用）

二、Ollama 本地部署 Gemma 4

2.1 环境要求

# 推荐配置
- CPU：8 核以上
- 内存：16GB+（27B 建议 32GB）
- 磁盘：20GB 可用空间
- 系统：macOS / Linux / Windows WSL

2.2 安装 Ollama

# macOS / Linux
curl -fsSL https://ollama.com/install.sh | sh

# 验证安装
ollama --version

2.3 拉取 Gemma 4 模型

# 根据硬件选择版本

# 轻量版（4B，适合低配）
ollama pull gemma4:4b

# 标准版（12B，推荐）
ollama pull gemma4:12b

# 高性能版（27B，需 32GB+ 内存）
ollama pull gemma4:27b

下载速度：国内用户可能需要 10-30 分钟

2.4 测试运行

# 命令行对话
ollama run gemma4:12b

# 测试提问
>>> 介绍一下你自己
我是 Google 开发的 Gemma 4 大语言模型...

2.5 启动 API 服务

# 后台运行 API 服务
ollama serve

# 测试 API
curl http://localhost:11434/api/generate -d '{
  "model": "gemma4:12b",
  "prompt": "你好"
}'

三、配置到 OpenClaw

3.1 OpenClaw 配置路径

# 配置文件位置
~/.openclaw/config.yaml

3.2 添加 Ollama 模型

编辑 config.yaml：

models:
  # 原有配置...
  
  # 添加 Gemma 4 本地模型
  gemma4-local:
    provider: ollama
    base_url: http://localhost:11434
    model: gemma4:12b
    timeout: 120s

3.3 配置默认模型（可选）

# 设置 Gemma 4 为默认模型
default_model: gemma4-local

3.4 重启 OpenClaw

openclaw restart

3.5 验证配置

# 查看模型列表
openclaw models list

# 测试对话
openclaw chat --model gemma4-local "你好"

四、进阶配置

4.1 多模型切换

models:
  gemma4-fast:
    provider: ollama
    model: gemma4:4b
    
  gemma4-balanced:
    provider: ollama
    model: gemma4:12b
    
  gemma4-pro:
    provider: ollama
    model: gemma4:27b

4.2 显存优化（NVIDIA GPU）

# 安装 CUDA 版 Ollama
ollama run --gpus all gemma4:12b

# 查看显存使用
nvidia-smi

4.3 远程访问（局域网共享）

# 绑定到所有网卡
OLLAMA_HOST=0.0.0.0:11434 ollama serve

# 其他设备配置
base_url: http://你的IP:11434

五、实际使用场景

5.1 代码辅助

# 分析代码
openclaw chat --model gemma4-local "解释这段代码：$(cat main.py)"

5.2 文档处理

# 128K 上下文优势，可处理整本书
openclaw chat --model gemma4-local "总结这份文档要点：$(cat report.pdf)"

5.3 隐私保护场景

公司内部文档分析
个人日记整理
敏感数据处理

六、性能对比实测

6.1 生成速度测试

模型	生成速度 (tokens/s)	内存占用
Gemma 4 4B	45	3GB
Gemma 4 12B	28	9GB
Gemma 4 27B	12	20GB
GPT-4 (API)	20-40	不适用

6.2 质量对比

任务：写一段 Python 快速排序

Gemma 4 12B：✅ 正确，带注释
Gemma 4 27B：✅ 正确，带注释+复杂度分析
GPT-4：✅ 正确，更详细的解释

七、常见问题

Q1: 下载太慢怎么办？

# 使用镜像加速
export OLLAMA_MODELS=/path/to/models
# 或使用代理
export HTTPS_PROXY=http://proxy:port

Q2: 内存不足怎么办？

# 使用量化版本（更小更快）
ollama pull gemma4:12b-q4_0

Q3: 和 OpenClaw 连接失败？

# 检查 Ollama 服务
ollama ps

# 检查端口
lsof -i :11434

# 测试 API 连通性
curl http://localhost:11434/api/tags

Q4: 如何更新模型？

# 重新拉取最新版本
ollama pull gemma4:12b

八、总结

Gemma 4 的发布标志着开源模型进入可用时代：

性能强：27B 打平 GPT-4
门槛低：Ollama 一键部署
成本低：本地运行零 API 费用
隐私好：数据不出本机

配合 OpenClaw，你可以：

替代昂贵的 API 调用
构建私有 AI 工作流
离线环境下使用 AI