GPUShare Quickstart

一个 API Key, 三种 SDK, 接入 30+ 主流大模型

GPUShare Quickstart

用任何 SDK 调任何模型, 无需修改代码

GPUShare 是多协议 AI 网关。你已经用熟的 OpenAI / Anthropic / Google Gemini SDK, 可以直接调用 30+ 个主流模型 —— 包括 Claude / GPT / Gemini / Grok / DeepSeek / Kimi / 千问 / MiniMax / GLM 全系。

1. 获取 API Key

访问 model.dflop.top 注册并创建 API Key:

  • 控制台路径: Dashboard → API Keys → Create Key
  • 充值: 最低 $1
  • 格式: sk-gpushare-{32 字符}
  • 每个 Key 独立预算,可配额限制
  • 原始 Key 只展示一次,务必当场复制
export GPUSHARE_API_KEY=sk-gpushare-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

2. 选择你已经在用的 SDK

2.1 OpenAI SDK

from openai import OpenAI

client = OpenAI(
    base_url="https://api.dflop.top/v1",
    api_key="sk-gpushare-xxx",
)

# 调用任意 30+ 模型 —— 包括非 OpenAI 家
response = client.chat.completions.create(
    model="claude-sonnet-4-5-20250929",  # 用 OpenAI SDK 调 Claude
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

完整 Python / TypeScript / curl 示例见 OpenAI SDK 指南

2.2 Anthropic SDK

from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.dflop.top",  # ⚠️ 不带 /v1
    api_key="sk-gpushare-xxx",
)

# 调用任意 30+ 模型 —— 包括非 Anthropic 家
message = client.messages.create(
    model="gpt-5.4",                    # 用 Anthropic SDK 调 GPT
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello"}],
)
print(message.content[0].text)

完整示例见 Anthropic SDK 指南

2.3 Google Gemini SDK

from google import genai

client = genai.Client(
    api_key="sk-gpushare-xxx",
    http_options={"base_url": "https://api.dflop.top"},
)

# 调用任意 30+ 模型 —— 包括非 Gemini 家
response = client.models.generate_content(
    model="glm-5.1",                    # 用 Gemini SDK 调 GLM
    contents="Hello",
)
print(response.text)

完整示例见 Gemini SDK 指南

3. 它是怎么工作的?

GPUShare 内部有一套协议自适配引擎:

你的 SDK (OpenAI / Anthropic / Gemini)
        ↓
GPUShare Gateway: 自动翻译协议
        ├─ T1: OpenAI Chat   → Anthropic Messages
        ├─ T2: OpenAI Chat   → Gemini Native
        ├─ T3: Anthropic     → OpenAI Chat
        ├─ T4: Gemini Native → OpenAI Chat
        └─ T6: Gemini Native → Anthropic Messages
        ↓
上游 model (Claude / GPT / Gemini / GLM / DeepSeek / Grok / ...)
        ↓
响应翻译回你 SDK 期望的 shape
        ↓
你的代码无感知

兼容矩阵 99 个组合中,84 个原生直通(byte-faithful)、9 个走协议翻译、6 个暂未支持。 你不需要了解走哪条 —— 网关自动选最优路径。完整矩阵: 兼容矩阵

4. 客户端集成

GPUShare 在主流 AI Coding 客户端里可作为 Custom API Provider 接入:

5. 模型推荐

按厂商

厂商模型 ID推荐 SDK
Anthropicclaude-opus-4-5-20251101, claude-sonnet-4-5-20250929Anthropic SDK
OpenAIgpt-5.4, gpt-5.5OpenAI SDK
Googlegemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-previewGemini SDK
xAIgrok-4, grok-4.1, grok-4.2, grok-4-fast-reasoning, grok-4-fast-non-reasoning任意
智谱glm-4.5/-air/-airx/-flash/-x, glm-4.6, glm-4.7, glm-5, glm-5-turbo, glm-5.1任意
DeepSeekdeepseek-v3.1, deepseek-v3.2, deepseek-v4-flash, deepseek-v4-pro任意
Moonshotkimi-k2.5, kimi-k2.6任意
MiniMaxMiniMax-M2.5, MiniMax-M2.7任意
Alibabaqwen3.5-plus, qwen3.6-plus任意

按用途

用途推荐 model理由
复杂推理 / agentclaude-opus-4-5-20251101最强推理,200K 上下文 + vision + thinking
日常 codingclaude-sonnet-4-5-20250929, gpt-5.4平衡价格性能
秒级响应glm-4.5-flash, gemini-2.5-flash, grok-4-fast-non-reasoning低延迟
国内合规 (中文场景)glm-5.1, qwen3.6-plus, deepseek-v3.2国内厂家
长上下文gemini-2.5-pro (2M), grok-4-fast-* (2M), kimi-k2.6 (256K)上下文窗口
极便宜批量glm-4.5-flash ($0.05/M), grok-4-fast-* ($0.2/M), deepseek-v3.2 ($0.27/M)$0.05–$0.30/M 量级
多模态视觉claude-*, gpt-5.x, gemini-*, grok-4, grok-4.x支持 vision input

限制: Gemini 系列暂不支持 Anthropic Messages 端点 (Anthropic→Gemini 翻译在路线图中); GPT-5.x 暂不支持 Gemini Native 端点。其他组合 99% 可用。详见 兼容矩阵

6. 计费

  • 预付费 + 配额制: 充值进 Key 预算池,按 token 消耗扣减
  • 每个 Key 独立: 不同业务线建议建不同 Key,便于审计与限额
  • 错误统一返回: HTTP 4xx/5xx + 协议本家 JSON shape (OpenAI / Anthropic / Gemini 三种返回格式)
  • 配额超限: HTTP 412 + quota_exhausted,需充值或新建 Key

7. 下一步