GPT-5 技术提升与数据指标整理

GPT-5 技术提升与数据指标整理


发布状态


OpenAI 于 2025 年 8 月 7 日正式发布 GPT-5,采用统一智能系统架构,整合了 GPT 系列的多模态能力与 o 系列的推理技术,无需用户手动切换模型。免费用户可使用基础版,Plus/Pro 用户解锁高级功能。

核心技术提升


  1. 统一架构
    采用专家路由系统(Expert Router),动态调度 16 个专家模块(每个含 1110 亿参数),单次推理仅激活 2800 亿参数,能耗降低 40%。
  2. 多模态升级
    原生支持文本 / 图像 / 音频 / 视频处理,可生成 3D 模型和 CAD 图纸,视频解析延迟低于 0.5 秒。
  3. 推理能力突破

    • 数学推理:AIME 2025 测试准确率 94.6%
    • 代码能力:SWE-bench Verified 得分 74.9%,可生成完整游戏原型
    • 逻辑推理:GSM8K 数学题正确率 98%

关键数据指标


指标 GPT-5 数据 GPT-4 对比值
参数规模 1.8 万亿 1.8 万亿(持平)
训练数据量 1.56T 字符 1.4T 字符(+11.4%)
上下文窗口 128K tokens 8K tokens(+1500%)
幻觉率 较 GPT-4o 降低 45% -
MMLU 得分 92.4% 86.4%(+6%)

全球排名


  1. 综合能力:2025 年 7 月全球 AI 大模型排行榜位列第一,超越 Google Gemini 2.0 Ultra 和 DeepSeek-R1。
  2. 细分领域
    • 代码生成:超越 Claude 4.1(83%→87%)
    • 多模态处理:略逊于 Gemini 2.5(不支持视频生成)
    • 中文理解:落后于 DeepSeek-R1(95% vs 98.3%)

图文对比分析


image

设计说明

  • 采用极简未来主义风格,黑色背景搭配紫色粒子光效,突出数据对比
  • 粉色标识 GPT-5,蓝色标识 Gemini Ultra,绿色标识 DeepSeek-R1
  • 核心差异:GPT-5 在参数规模(3-5 万亿)和多模态支持(5 种)上领先,DeepSeek-R1 代码能力更优(HumanEval 75.9%)
阅读: 5498 | 发布时间: 2025-08-08 14:22:24