How much does GPT-5 API cost in 2026?

GPT-5 has two pricing tiers. In reasoning mode: $2 per 1M input tokens and $10 per 1M output tokens. In standard (non-reasoning) mode: $0.50 per 1M input and $2 per 1M output. This compares favorably to GPT-4o ($2.50/$10) and is significantly cheaper than Claude Opus 4 ($15/$75) while being more expensive than DeepSeek V4 Pro ($0.435/$0.87).

What is the context window of GPT-5?

GPT-5 supports a 1 million token context window — a 5x increase over GPT-4o and 25x over GPT-4 Turbo. This is equivalent to processing approximately 750,000 words, three full-length novels, or an entire codebase in a single prompt without chunking or RAG. In early 2026, only GPT-5 and DeepSeek V4 Flash/Pro offer 1M context windows at production scale.

How does GPT-5 compare to DeepSeek V4 Pro?

GPT-5 and DeepSeek V4 Pro are the two leading frontier models in 2026. GPT-5 offers $2/$10 pricing (reasoning mode) vs DeepSeek V4 Pro at $0.435/$0.87. DeepSeek V4 Pro is roughly 4-11x cheaper but GPT-5 offers stronger reasoning capabilities, deeper tool-use integration, and OpenAI ecosystem compatibility. Developers building agentic workflows often run both models through a unified gateway like TokenPAPA.

Can I access GPT-5 API from outside the US?

Yes. While OpenAI directly supports API access in most regions, developers in certain countries face payment or registration barriers. Platforms like TokenPAPA provide GPT-5 API access with an OpenAI-compatible endpoint, no region restrictions, and support for global payment methods including PayPal, credit cards, and cryptocurrency.

2026 年 GPT-5 API 完整指南。最新定价（$2/1M 输入、$10/1M 输出）、100 万 token 上下文窗口、推理模式、流式传输和 Python 集成。含与 DeepSeek V4、Claude 对比。

GPT-5 API 完整开发者指南 (2026)：定价、功能与代码示例

发布日期：2026 年 6 月 27 日 · 阅读时间：12 分钟

引言

OpenAI 于 2026 年初发布的 GPT-5，是该公司迄今为止最具雄心的模型。凭借 100 万 token 的上下文窗口、堪比顶尖思维链模型的专用推理模式，以及在输出 token 上比 GPT-4o 更低廉的定价策略，GPT-5 迅速成为开发者构建生产级 AI 应用的首选模型。

本指南涵盖 2026 年 GPT-5 API 你需要了解的一切——定价、核心功能、与 DeepSeek V4 和 Claude Opus 4 等竞品的对比、实用的 Python 代码示例，以及如何通过 TokenPAPA 与其他领先模型一起使用 GPT-5。

核心要点： GPT-5 是第一款同时提供 100 万上下文窗口、推理模式、结构化输出和实时 API 的 OpenAI 模型——这些能力此前需要在不同模型之间切换。它实际上取代了 GPT-4o、o1 和 o3-mini，成为一个统一模型。

GPT-5 核心功能

100 万 Token 上下文窗口

GPT-5 的 100 万上下文是一项革命性突破。相比 GPT-4o（200K）提升了 5 倍，相比 GPT-4 Turbo（32K）提升了 25 倍。

模型	上下文窗口	等效文本量
GPT-5	1,048,576 tokens	~75 万字（3 部长篇小说）
GPT-4o	200,000 tokens	~15 万字
GPT-4o-mini	128,000 tokens	~9.6 万字
GPT-4 Turbo	32,000 tokens	~2.4 万字

这意味着你可以在单个提示中传入整个代码库、完整书籍或数小时的对话记录，无需分块或使用 RAG。

推理模式

GPT-5 通过 reasoning_effort 参数引入了专用推理模式，取代了 OpenAI 之前的 o1/o3 产品线：

low — 简单逻辑、分类和路由的快速推理
medium — 默认平衡推理，适用于常规问题求解
high — 深度思维链，适用于数学、科学和复杂规划

推理模式会产生额外的输出 token 费用，但在多步骤逻辑推理任务上能带来显著更优的结果。

结构化输出与实时 API

GPT-5 原生支持通过 response_format 配合 JSON Schema 验证的结构化输出，省去了生产环境中的手动解析工作。它还驱动着 OpenAI 支持 WebRTC 的实时 API，为智能体应用提供低延迟的语音和文本交互。

GPT-5 定价

OpenAI 为 GPT-5 引入了双重定价结构：

模式	输入（每 1M tokens）	输出（每 1M tokens）
标准（非推理）	$0.50	$2.00
推理（low/medium）	$2.00	$10.00
推理（high）	$2.00	$15.00
缓存输入	$0.125	—

与其他 OpenAI 模型对比

模型	输入（每 1M tokens）	输出（每 1M tokens）
GPT-5（推理）	$2.00	$10.00
GPT-5（标准）	$0.50	$2.00
GPT-4o	$2.50	$10.00
GPT-4o-mini	$0.15	$0.60
o1（已停用）	$15.00	$60.00

GPT-5 标准模式的输入和输出价格比 GPT-4o 便宜 5 倍。即使在推理模式下，其输出价格也与 GPT-4o 持平，而输入价格便宜了 20%。

GPT-5 vs 竞品

模型	输入（每 1M）	输出（每 1M）	上下文	最佳用途
GPT-5（推理）	$2.00	$10.00	1M	通用推理、工具调用、生态集成
DeepSeek V4 Pro	$0.435	$0.87	1M	高性价比编码与分析
DeepSeek V4 Flash	$0.14	$0.14	1M	高吞吐、缓存友好的工作负载
Claude Opus 4	$15.00	$75.00	200K	安全关键、高风险推理
Claude Sonnet 4	$3.00	$15.00	200K	指令遵循、工具调用
Gemini 2.5 Pro	$1.25	$5.00	1M	Google Cloud 集成、多模态

DeepSeek V4 Pro vs GPT-5

DeepSeek V4 Pro 在推理模式下比 GPT-5 便宜 4-11 倍。对于成本敏感的工作负载——批量处理、数据提取、大规模代码生成——DeepSeek V4 Pro 提供了最佳的性价比。然而，GPT-5 在复杂智能体应用中提供了更深入的推理能力和更强大的工具调用集成。详情请见我们的 DeepSeek V4 Flash vs V4 Pro 对比指南。

Claude Opus 4 vs GPT-5

Claude Opus 4 价格为每 1M tokens $15/$75，大约是 GPT-5 推理模式的 7.5 倍。它面向安全关键型应用，如法律分析、医疗诊断和金融建模。对于通用用途，GPT-5 以极低的成本提供了有竞争力的推理能力。更广泛的对比请见我们的 2026 年 LLM API 定价对比。

如何在 Python 中使用 GPT-5 API

GPT-5 使用 OpenAI Chat Completions API，兼容 openai Python 包。以下示例均通过 TokenPAPA 统一网关实现。

环境准备

pip install openai

示例 1：基础对话补全（标准模式）

from openai import OpenAI

client = OpenAI(
    api_key="your-tokenpapa-api-key",
    base_url="https://api.tokenpapa.ai/v1"
)

response = client.chat.completions.create(
    model="gpt-5",
    messages=[
        {"role": "system", "content": "你是一位资深软件工程师。"},
        {"role": "user", "content": "解释 Rust 所有权和 Go 垃圾回收的区别。"}
    ],
    temperature=0.7,
    max_tokens=500
)
print(response.choices[0].message.content)

示例 2：中等推理模式

from openai import OpenAI

client = OpenAI(
    api_key="your-tokenpapa-api-key",
    base_url="https://api.tokenpapa.ai/v1"
)

response = client.chat.completions.create(
    model="gpt-5",
    messages=[
        {"role": "user", "content": "一个球拍和一个球总共 1.10 美元。球拍比球贵 1.00 美元。球多少钱？请逐步思考。"}
    ],
    reasoning_effort="medium",
    max_tokens=2000
)
print(response.choices[0].message.content)

示例 3：高推理模式流式传输

from openai import OpenAI

client = OpenAI(
    api_key="your-tokenpapa-api-key",
    base_url="https://api.tokenpapa.ai/v1"
)

stream = client.chat.completions.create(
    model="gpt-5",
    messages=[{"role": "user", "content": "写一个合并两个有序链表的 Python 函数。"}],
    reasoning_effort="high",
    stream=True,
    max_tokens=3000
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

示例 4：Pydantic 结构化输出

from openai import OpenAI
from pydantic import BaseModel

client = OpenAI(
    api_key="your-tokenpapa-api-key",
    base_url="https://api.tokenpapa.ai/v1"
)

class CalendarEvent(BaseModel):
    name: str
    date: str
    participants: list[str]

completion = client.beta.chat.completions.parse(
    model="gpt-5",
    messages=[{"role": "user", "content": "明天上午 10 点安排一个团队站会，参加者有 Alice、Bob 和 Charlie。"}],
    response_format=CalendarEvent,
)

event = completion.choices[0].message.parsed
print(f"事件：{event.name}，日期：{event.date}，参与者：{', '.join(event.participants)}")

示例 5：100 万上下文——分析整个代码库

from openai import OpenAI
import os

client = OpenAI(
    api_key="your-tokenpapa-api-key",
    base_url="https://api.tokenpapa.ai/v1"
)

codebase = ""
for root, dirs, files in os.walk("./my_project"):
    for file in files:
        if file.endswith(".py"):
            path = os.path.join(root, file)
            with open(path, "r") as f:
                codebase += f"\n\n# --- {path} ---\n\n" + f.read()
                if len(codebase) > 800_000:
                    break
    if len(codebase) > 800_000:
        break

response = client.chat.completions.create(
    model="gpt-5",
    messages=[
        {"role": "system", "content": "你是一位资深代码审查专家。"},
        {"role": "user", "content": f"审查以下代码库中的 Bug 和安全问题：\n\n{codebase}"}
    ],
    reasoning_effort="high",
    max_tokens=8000
)
print(response.choices[0].message.content)

GPT-5 应用场景

1. 高级编码辅助

GPT-5 的推理模式和 100 万上下文使得在单个提示中对整个仓库进行架构级代码审查、重构建议和安全审计成为可能。

2. 长文档分析

法律合同、学术论文和完整书籍可以一次性分析，无需分块。推理模式擅长从数百页篇幅中提取细致入微的论点并交叉引用各章节内容。

3. 智能体工作流

原生工具调用、结构化输出和实时 API 支持，使 GPT-5 成为能够以高可靠性规划、执行和验证多步骤操作的生产级 AI 智能体的理想选择。

4. 规模化内容生成

在标准模式下每 1M tokens 仅 $0.50/$2，GPT-5 在生成文章、文档、营销文案和翻译方面成本效益极高，且支持结构化输出集成。

5. 数据提取

基于 JSON Schema 的结构化输出让你能够从非结构化来源（邮件、PDF、网页）中提取结构化数据，并保证输出有效的 JSON。

通过 TokenPAPA 访问 GPT-5

TokenPAPA 是一个统一的 LLM API 网关，通过单个兼容 OpenAI 的端点提供对 GPT-5 及 30 多个模型（包括 DeepSeek V4 Flash/Pro、Claude Sonnet 4 和 Opus 4、Gemini 2.5 Pro/Flash、MiniMax、Moonshot 等）的访问。

为什么选择 TokenPAPA？

统一访问 — 一个 API Key 即可使用 GPT-5、DeepSeek、Claude、Gemini 和 30 多个供应商
无地域限制 — 从全球任何地方访问 GPT-5
灵活支付 — 支持 PayPal、信用卡和加密货币
有竞争力的价格 — 与直接提供商相同费率，无最低消费承诺

from openai import OpenAI

client = OpenAI(
    api_key="your-tokenpapa-api-key",
    base_url="https://api.tokenpapa.ai/v1"
)

response = client.chat.completions.create(
    model="gpt-5",
    messages=[{"role": "user", "content": "2026 年 AI 的主要趋势是什么？"}],
    reasoning_effort="medium"
)
print(response.choices[0].message.content)

如需更全面的模型对比，请参阅我们的 2026 年最佳 LLM API 指南和 2026 年 LLM API 定价对比。

GPT-5 API 完整开发者指南 (2026)：定价、功能与代码示例

GPT-5 API 完整开发者指南 (2026)：定价、功能与代码示例

引言

GPT-5 核心功能

100 万 Token 上下文窗口

推理模式

结构化输出与实时 API

GPT-5 定价

与其他 OpenAI 模型对比

GPT-5 vs 竞品

DeepSeek V4 Pro vs GPT-5

Claude Opus 4 vs GPT-5

如何在 Python 中使用 GPT-5 API

环境准备

示例 1：基础对话补全（标准模式）

示例 2：中等推理模式

示例 3：高推理模式流式传输

示例 4：Pydantic 结构化输出

示例 5：100 万上下文——分析整个代码库

GPT-5 应用场景

1. 高级编码辅助

2. 长文档分析

3. 智能体工作流

4. 规模化内容生成

5. 数据提取

通过 TokenPAPA 访问 GPT-5

常见问题

GPT-5 比 GPT-4o 更好吗？

GPT-5 支持函数调用吗？

推理模式如何影响定价？

能否将 GPT-5 用于实时语音应用？

开始使用 GPT-5

目录