2025-08-08 06:15:22

GPT-5正式发布：多模态能力突破，上下文窗口达40万标记

摘要

OpenAI周四正式推出GPT-5，支持文本、图像、语音及实时视频交互，上下文窗口达40万标记。免费用户可体验标准版，专业用户享无限制访问。该模型在推理能力与事实准确性上显著提升，但尚未达到通用人工智能水平。

OpenAI于周四正式发布其最新一代语言模型GPT-5，标志着人工智能在多模态处理与深度推理能力上的重大飞跃。该模型已全面上线ChatGPT平台，并通过API向开发者开放，微软亦同步将其集成至Copilot与GitHub Copilot服务中，用户更新Edge浏览器即可使用。 H2: GPT-5的核心优势解析 GPT-5最引人注目的特性在于其统一的多模态处理能力。它可在同一对话中理解并生成文本、图像、语音乃至实时视频内容，无需在Vision、Sora或GPT系列模型间切换。这一整合极大提升了用户体验的一致性与效率。此外，模型具备高达256,000个标记的输入上下文窗口，最大总长度可达400,000标记，相当于处理一部长篇小说级别的文档而保持语义连贯。 H2: 用户分级与定价策略保持稳定尽管功能大幅提升，订阅价格未作调整。ChatGPT Plus用户每月20美元，Pro用户每月200美元。针对API使用者，GPT-5标准版每百万输入令牌收费1.25美元，输出为10美元；轻量版本GPT-5 mini和nano则分别定价0.25/2美元与0.05/0.40美元，相较此前高端模型更具成本竞争力。 H2: 真实世界应用能力增强演示中，GPT-5仅用两分钟便从零构建了一个伯努利效应模拟程序，代码超过400行，展现强大编码能力。它还能分析上传图像、理解实时视频流并提供即时指导，例如帮助用户修理自行车。下周还将支持与Gmail和Google日历的整合，进一步强化日常任务管理助手角色。 H2: 可靠性与记忆机制实现质变据OpenAI首席科学家Jakub Pachocki表示，GPT-5在事实准确率上较前代o3模型减少约80%的错误，显著降低“幻觉”现象。同时，其会话记忆能力大幅增强，即使间隔数日后重新登录，仍能保留多个对话中的偏好与目标设定，如长期健康减重计划或备考安排，使响应更具个性化与持续性。 H2: 距AGI仍有距离，但迈出关键一步尽管性能跃升，但OpenAI明确指出，当前版本尚未实现通用人工智能（AGI）。GPT-5仍聚焦于特定任务优化，缺乏自主学习与跨领域适应能力。视频生成功能暂未内置，仍需依赖独立产品Sora，但未来版本将逐步纳入。 H2: 数据隐私与法律合规问题依然存在 CEO Sam Altman承认，在法律强制要求下，OpenAI可能需向政府提供用户数据。这一声明引发对个人隐私保护的关注，尤其在企业级部署场景中需谨慎评估风险。随着GPT-5的推出，OpenAI正推动其所有AI能力向单一系统收敛。这意味着用户不再需要在不同模型之间频繁切换，只需根据速度与成本需求在GPT-5、GPT-5 mini与GPT-5 nano之间选择即可。这一战略转变不仅简化了技术生态，也预示着未来人工智能应用将更加无缝、高效与智能。