GPUShare Quickstart
一个 API Key, 三种 SDK, 接入 30+ 主流大模型
GPUShare Quickstart
用任何 SDK 调任何模型, 无需修改代码
GPUShare 是多协议 AI 网关。你已经用熟的 OpenAI / Anthropic / Google Gemini SDK, 可以直接调用 30+ 个主流模型 —— 包括 Claude / GPT / Gemini / Grok / DeepSeek / Kimi / 千问 / MiniMax / GLM 全系。
1. 获取 API Key
访问 model.dflop.top 注册并创建 API Key:
- 控制台路径: Dashboard → API Keys → Create Key
- 充值: 最低 $1
- 格式:
sk-gpushare-{32 字符} - 每个 Key 独立预算,可配额限制
- 原始 Key 只展示一次,务必当场复制
export GPUSHARE_API_KEY=sk-gpushare-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
2. 选择你已经在用的 SDK
2.1 OpenAI SDK
from openai import OpenAI
client = OpenAI(
base_url="https://api.dflop.top/v1",
api_key="sk-gpushare-xxx",
)
# 调用任意 30+ 模型 —— 包括非 OpenAI 家
response = client.chat.completions.create(
model="claude-sonnet-4-5-20250929", # 用 OpenAI SDK 调 Claude
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)
完整 Python / TypeScript / curl 示例见 OpenAI SDK 指南。
2.2 Anthropic SDK
from anthropic import Anthropic
client = Anthropic(
base_url="https://api.dflop.top", # ⚠️ 不带 /v1
api_key="sk-gpushare-xxx",
)
# 调用任意 30+ 模型 —— 包括非 Anthropic 家
message = client.messages.create(
model="gpt-5.4", # 用 Anthropic SDK 调 GPT
max_tokens=1024,
messages=[{"role": "user", "content": "Hello"}],
)
print(message.content[0].text)
完整示例见 Anthropic SDK 指南。
2.3 Google Gemini SDK
from google import genai
client = genai.Client(
api_key="sk-gpushare-xxx",
http_options={"base_url": "https://api.dflop.top"},
)
# 调用任意 30+ 模型 —— 包括非 Gemini 家
response = client.models.generate_content(
model="glm-5.1", # 用 Gemini SDK 调 GLM
contents="Hello",
)
print(response.text)
完整示例见 Gemini SDK 指南。
3. 它是怎么工作的?
GPUShare 内部有一套协议自适配引擎:
你的 SDK (OpenAI / Anthropic / Gemini)
↓
GPUShare Gateway: 自动翻译协议
├─ T1: OpenAI Chat → Anthropic Messages
├─ T2: OpenAI Chat → Gemini Native
├─ T3: Anthropic → OpenAI Chat
├─ T4: Gemini Native → OpenAI Chat
└─ T6: Gemini Native → Anthropic Messages
↓
上游 model (Claude / GPT / Gemini / GLM / DeepSeek / Grok / ...)
↓
响应翻译回你 SDK 期望的 shape
↓
你的代码无感知
兼容矩阵 99 个组合中,84 个原生直通(byte-faithful)、9 个走协议翻译、6 个暂未支持。 你不需要了解走哪条 —— 网关自动选最优路径。完整矩阵: 兼容矩阵。
4. 客户端集成
GPUShare 在主流 AI Coding 客户端里可作为 Custom API Provider 接入:
- Claude Code —— 把
ANTHROPIC_BASE_URL指向 GPUShare - Cursor / Cline 等 —— Custom OpenAI 接口
5. 模型推荐
按厂商
| 厂商 | 模型 ID | 推荐 SDK |
|---|---|---|
| Anthropic | claude-opus-4-5-20251101, claude-sonnet-4-5-20250929 | Anthropic SDK |
| OpenAI | gpt-5.4, gpt-5.5 | OpenAI SDK |
gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview | Gemini SDK | |
| xAI | grok-4, grok-4.1, grok-4.2, grok-4-fast-reasoning, grok-4-fast-non-reasoning | 任意 |
| 智谱 | glm-4.5/-air/-airx/-flash/-x, glm-4.6, glm-4.7, glm-5, glm-5-turbo, glm-5.1 | 任意 |
| DeepSeek | deepseek-v3.1, deepseek-v3.2, deepseek-v4-flash, deepseek-v4-pro | 任意 |
| Moonshot | kimi-k2.5, kimi-k2.6 | 任意 |
| MiniMax | MiniMax-M2.5, MiniMax-M2.7 | 任意 |
| Alibaba | qwen3.5-plus, qwen3.6-plus | 任意 |
按用途
| 用途 | 推荐 model | 理由 |
|---|---|---|
| 复杂推理 / agent | claude-opus-4-5-20251101 | 最强推理,200K 上下文 + vision + thinking |
| 日常 coding | claude-sonnet-4-5-20250929, gpt-5.4 | 平衡价格性能 |
| 秒级响应 | glm-4.5-flash, gemini-2.5-flash, grok-4-fast-non-reasoning | 低延迟 |
| 国内合规 (中文场景) | glm-5.1, qwen3.6-plus, deepseek-v3.2 | 国内厂家 |
| 长上下文 | gemini-2.5-pro (2M), grok-4-fast-* (2M), kimi-k2.6 (256K) | 上下文窗口 |
| 极便宜批量 | glm-4.5-flash ($0.05/M), grok-4-fast-* ($0.2/M), deepseek-v3.2 ($0.27/M) | $0.05–$0.30/M 量级 |
| 多模态视觉 | claude-*, gpt-5.x, gemini-*, grok-4, grok-4.x | 支持 vision input |
限制: Gemini 系列暂不支持 Anthropic Messages 端点 (Anthropic→Gemini 翻译在路线图中); GPT-5.x 暂不支持 Gemini Native 端点。其他组合 99% 可用。详见 兼容矩阵。
6. 计费
- 预付费 + 配额制: 充值进 Key 预算池,按 token 消耗扣减
- 每个 Key 独立: 不同业务线建议建不同 Key,便于审计与限额
- 错误统一返回: HTTP 4xx/5xx + 协议本家 JSON shape (OpenAI / Anthropic / Gemini 三种返回格式)
- 配额超限: HTTP 412 +
quota_exhausted,需充值或新建 Key
7. 下一步
- 完整 API 参考: api-reference
- 鉴权细节: authentication
- 状态页 & SLA: status.dflop.top
- 反馈渠道: community.dflop.top