Open WebUI 集成

自托管 ChatGPT-like 界面通过 OpenAI API connection 接入 GPUShare

Open WebUI 集成

Open WebUI 是开源 ChatGPT-like 界面,支持自托管 + 多模型 + 用户系统,通过 OpenAI 兼容 API connection 接入 GPUShare 后所有 33 个模型立即可用。

安装 (Docker)

docker run -d \
  -p 3000:8080 \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

访问 http://localhost:3000,首次创建管理员账户。

配置

  1. Settings → ⚙️ Connections
  2. OpenAI API 部分:
    • API Base URL: https://api.dflop.top/v1
    • API Key: sk-gpushare-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
  3. Verify Connection 确认连通
  4. 保存

模型选择

保存连接后,所有 GPUShare 支持的模型自动出现在模型选择器中(从 GET /v1/models 拉取)。

如果只想暴露子集给用户:

  1. Settings → ⚙️ Models
  2. 把不想暴露的模型 toggle off

多用户 / 团队场景

Open WebUI 自带用户系统,但所有用户共享一把 GPUShare Key 的预算。建议:

  1. 为 Open WebUI 单建一把高预算 Key (例 $50)
  2. model.dflop.top/keys 监控用量
  3. 通过 Open WebUI 自己的 user permissions 限制单用户能用哪些模型

RAG / Embeddings

Open WebUI 的 RAG (knowledge base) 需要 embedding 模型。GPUShare 当前不提供 embedding —— 切到本地 ollama 或 OpenAI 原厂:

Settings → ⚙️ DocumentsEmbedding Model Engine:

  • Ollama + nomic-embed-text (本地,免费)
  • OpenAI 走原厂

流式响应

Open WebUI 默认启用流式,跟 GPUShare 协议完全兼容。详见 流式响应

工具调用

Open WebUI 的 Functions 系统支持 OpenAI function tools 调用,GPUShare 33 个模型都支持。详见 工具调用

Web Search

Open WebUI 自身的 Web Search 是独立功能,不走 GPUShare 的 web_search tool。两者可平行使用:

  • Open WebUI Web Search → 走你配的 SearXNG / Google CSE / Brave API
  • GPT-5.x 的 web_search tool → 走 GPUShare 内置

常见问题

现象排查
模型列表为空API Base URL 拼写;/v1 不能少
401 / 403API Key 是否复制全
流式不工作Open WebUI 反向代理 buffering 是否关 (Nginx proxy_buffering off)
用量超出预算建议每个团队 / 项目独立 Key

其他客户端