Open WebUI 集成
自托管 ChatGPT-like 界面通过 OpenAI API connection 接入 GPUShare
Open WebUI 集成
Open WebUI 是开源 ChatGPT-like 界面,支持自托管 + 多模型 + 用户系统,通过 OpenAI 兼容 API connection 接入 GPUShare 后所有 33 个模型立即可用。
安装 (Docker)
docker run -d \
-p 3000:8080 \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:main
访问 http://localhost:3000,首次创建管理员账户。
配置
- Settings → ⚙️ Connections
- OpenAI API 部分:
- API Base URL:
https://api.dflop.top/v1 - API Key:
sk-gpushare-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
- API Base URL:
- 点 Verify Connection 确认连通
- 保存
模型选择
保存连接后,所有 GPUShare 支持的模型自动出现在模型选择器中(从 GET /v1/models 拉取)。
如果只想暴露子集给用户:
- Settings → ⚙️ Models
- 把不想暴露的模型 toggle off
多用户 / 团队场景
Open WebUI 自带用户系统,但所有用户共享一把 GPUShare Key 的预算。建议:
- 为 Open WebUI 单建一把高预算 Key (例 $50)
- 在 model.dflop.top/keys 监控用量
- 通过 Open WebUI 自己的 user permissions 限制单用户能用哪些模型
RAG / Embeddings
Open WebUI 的 RAG (knowledge base) 需要 embedding 模型。GPUShare 当前不提供 embedding —— 切到本地 ollama 或 OpenAI 原厂:
Settings → ⚙️ Documents → Embedding Model Engine:
Ollama+nomic-embed-text(本地,免费)- 或
OpenAI走原厂
流式响应
Open WebUI 默认启用流式,跟 GPUShare 协议完全兼容。详见 流式响应。
工具调用
Open WebUI 的 Functions 系统支持 OpenAI function tools 调用,GPUShare 33 个模型都支持。详见 工具调用。
Web Search
Open WebUI 自身的 Web Search 是独立功能,不走 GPUShare 的 web_search tool。两者可平行使用:
- Open WebUI Web Search → 走你配的 SearXNG / Google CSE / Brave API
- GPT-5.x 的
web_searchtool → 走 GPUShare 内置
常见问题
| 现象 | 排查 |
|---|---|
| 模型列表为空 | API Base URL 拼写;/v1 不能少 |
| 401 / 403 | API Key 是否复制全 |
| 流式不工作 | Open WebUI 反向代理 buffering 是否关 (Nginx proxy_buffering off) |
| 用量超出预算 | 建议每个团队 / 项目独立 Key |
其他客户端
- Claude Code — 命令行 AI 编程
- Cursor — IDE 内置 AI
- Cline (VS Code) — agentic AI Coding
- Continue.dev — VS Code / JetBrains
- FlopCode — GPUShare 官方 fork