完整模型列表

33 个模型 × 定价 × 上下文 × 能力位 (按 9 家厂商分组)

完整模型列表

GPUShare 当前提供 33 个模型 横跨 9 家厂商。所有定价为美元每 1M tokens。

数据来源: 公开 catalog endpoint GET https://api.dflop.top/api/v1/models/public,运行时自动同步。

表格符号

符号含义
支持
不支持
cached输入命中 prompt cache 的价格

Anthropic (2)

Model ID显示名上下文Input ($/1M)Output ($/1M)能力
claude-opus-4-5-20251101Claude Opus 4.5200K$15 (cached $1.5)$75tools / vision / thinking / json
claude-sonnet-4-5-20250929Claude Sonnet 4.5200K$3 (cached $0.3)$15tools / vision / thinking / json

Opus 4.5 是 Anthropic 当前最强模型,推理 / 编码 / 多模态全能。Sonnet 4.5 性价比首选 —— cache 命中时输入价 1/10,适合长 system prompt 场景。

OpenAI (2)

Model ID显示名上下文Input ($/1M)Output ($/1M)能力
gpt-5.4GPT-5.4400K$2.5 (cached $0.25)$15tools / vision / web_search / image_gen / thinking
gpt-5.5GPT-5.51M$5$30tools / vision / web_search / image_gen / thinking

GPT-5.x 在 web_search / image_generation 工具启用时走 sub2api WebSocket V2,纯文本对话走 HTTP 直连。

Google (4)

Model ID显示名上下文Input ($/1M)Output ($/1M)能力
gemini-2.5-flashGemini 2.5 Flash1M$0.3 (cached $0.075)$2.5tools / vision / json
gemini-2.5-proGemini 2.5 Pro2M$1.25 (cached $0.31)$10tools / vision / thinking / json
gemini-3-flash-previewGemini 3 Flash (Preview)1M$0.4 (cached $0.1)$3tools / vision / json
gemini-3-pro-previewGemini 3 Pro (Preview)2M$1.5 (cached $0.375)$12tools / vision / thinking / json

Gemini Preview 系列定价为估算,以最终发布为准。2.5 Pro 是当前 2M 上下文最便宜的旗舰模型。

xAI (5)

Model ID显示名上下文Input ($/1M)Output ($/1M)能力
grok-4Grok 4256K$3$15tools / vision / thinking
grok-4-fast-non-reasoningGrok 4 Fast (Non-Reasoning)2M$0.2$0.5tools
grok-4-fast-reasoningGrok 4 Fast (Reasoning)2M$0.2$0.5tools / thinking
grok-4.1Grok 4.1256K$5$25tools / vision / thinking
grok-4.2Grok 4.2256K$5$25tools / vision / thinking

Grok 4 Fast 是 2M 超长上下文 + $0.2/M 性价比之王。

智谱 GLM (10)

Model ID显示名上下文Input ($/1M)Output ($/1M)能力
glm-4.5GLM-4.5128K$0.6$2.2tools / thinking / open-source
glm-4.5-airGLM-4.5-Air128K$0.2$0.8tools / open-source
glm-4.5-airxGLM-4.5-AirX128K$0.3$1.2tools / open-source
glm-4.5-flashGLM-4.5-Flash32K$0.05$0.2tools / open-source
glm-4.5-xGLM-4.5-X128K$1.5$6tools / thinking
glm-4.6GLM-4.6200K$0.7$0.7tools / thinking / open-source
glm-4.7GLM-4.7200K$0.7$0.7tools / thinking / open-source
glm-5GLM-5200K$1.13$3.94tools / thinking / open-source
glm-5-turboGLM-5-Turbo200K$1.2$4tools / open-source
glm-5.1GLM-5.1200K$1.13$3.94tools / thinking / open-source

GLM-4.5-Flash 是全平台最便宜的模型($0.05/M)。GLM-4.7 是开源 355B MoE 旗舰,input/output 同价。

DeepSeek (4)

Model ID显示名上下文Input ($/1M)Output ($/1M)能力
deepseek-v3.1DeepSeek V3.1128K$0.27 (cached $0.07)$1.1tools / open-source
deepseek-v3.2DeepSeek V3.264K$0.27 (cached $0.07)$1.1tools / open-source
deepseek-v4-flashDeepSeek V4 Flash128K$0.15$0.6tools
deepseek-v4-proDeepSeek V4 Pro128K$0.5$2tools / thinking

Moonshot (2)

Model ID显示名上下文Input ($/1M)Output ($/1M)能力
kimi-k2.5Kimi K2.5256K$0.6$2.5tools / thinking / open-source
kimi-k2.6Kimi K2.6256K$0.6$2.5tools / thinking / open-source

MiniMax (2)

Model ID显示名上下文Input ($/1M)Output ($/1M)能力
MiniMax-M2.5MiniMax M2.51M$0.3$1.5tools
MiniMax-M2.7MiniMax M2.71M$0.3$1.5tools

Alibaba 通义千问 (2)

Model ID显示名上下文Input ($/1M)Output ($/1M)能力
qwen3.5-plusQwen 3.5 Plus128K$0.4$1.2tools / thinking
qwen3.6-plusQwen 3.6 Plus128K$0.5$1.5tools / thinking

按用途速选

用途推荐 model理由
最强推理 / agentclaude-opus-4-5-20251101200K + tools + vision + thinking
日常 codingclaude-sonnet-4-5-20250929, gpt-5.4平衡价格性能
秒级响应glm-4.5-flash, gemini-2.5-flash, grok-4-fast-non-reasoning低延迟
中文场景glm-5.1, qwen3.6-plus, deepseek-v3.2国内厂家
长上下文gemini-2.5-pro (2M), grok-4-fast-* (2M), kimi-k2.6 (256K)上下文窗口
极便宜批量glm-4.5-flash ($0.05/M), grok-4-fast-* ($0.2/M), deepseek-v3.2量级 $0.05–$0.30/M
多模态视觉claude-*, gpt-5.x, gemini-*, grok-4, grok-4.x支持 vision

跨厂商协议支持

不同模型支持的客户端 SDK 不同,详见 兼容矩阵:

  • OpenAI Chat 协议 —— 全部 33 个模型支持
  • Anthropic Messages 协议 —— 除 Gemini 全系外都支持
  • Gemini Native 协议 —— 除 GPT-5.x 外都支持

实时数据

模型列表 + 价格随上游变动,实时数据见 https://model.dflop.top/models 或:

curl https://api.dflop.top/api/v1/models/public | jq .