GPT-5.2 – OpenAI最新推出的通用AI模型系列，能高效处理长文档，支持端到端工作流

OpenAI正式推出其迄今最强模型GPT-5.2，专为专业工作和复杂任务设计。在通用智能、长文本处理、智能体工具调用和视觉等方面得到显著提升。在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长上下文等方面都优于前代产品，旨在”为人们创造更多经济价值”。GPT-5.2在数学推理方面的进步意味着它能更好地处理金融建模、预测和数据分析等任务。GPT-5.2 在多项基准测试中刷新了行业标准，如 GDPval 和 SWE-Bench Pro，同时降低了幻觉率，提升安全性和可靠性。

GPT-5.2是什么

GPT-5.2 是 OpenAI 最新发布的先进人工智能模型系列，模型提供三种版本：GPT-5.2 Instant 适用快速处理日常任务，如信息查询和翻译，GPT-5.2 Thinking 专为复杂任务优化，如编程、长文档处理和多步骤项目管理，GPT-5.2 Pro 专注于高难度任务，提供高精度和高可靠性，适合科学研究和复杂分析。

GPT-5.2的主要功能

专业工作优化：在制作电子表格、构建演示文稿、编写代码、处理长文档和执行复杂多步骤项目方面表现出色，显著提升工作效率。
强大的编程能力：在 SWE-Bench Pro 等基准测试中刷新记录，能可靠地调试代码、实现功能需求、重构大型代码库，并减少人工干预。
长文本处理：在长文档分析（如报告、合同、学术论文）中保持连贯性和准确性，适合深度分析和多源工作流。
视觉理解：在图表推理和软件界面理解方面表现出色，能准确解读数据仪表盘、技术图表和视觉报告。
工具调用：在长链路、多轮任务中可靠使用工具，支持端到端工作流，减少步骤间的断裂。
科学与数学辅助：在 GPQA Diamond 和 FrontierMath 等基准测试中表现优异，能辅助科学研究和解决复杂数学问题。
安全性提升：在处理敏感话题时更可靠，减少不良响应，保护用户安全。

GPT-5.2的性能表现

专业知识工作：
- 在 GDPval 基准测试中，GPT-5.2 Thinking 达到 70.9% 的胜率，首次超过人类专家水平。在 44 种职业的知识工作场景中表现出色，如制作演示文稿、电子表格、会计报表等。
- 在内部的初级投行分析师任务中，GPT-5.2 Thinking 的平均得分比 GPT-5.1 提高 9.3%，达到 68.4%。
编程能力：
- 在 SWE-Bench Pro 测试中，GPT-5.2 Thinking 达到 55.6% 的成绩，创下新高，显著优于之前的版本。
- 在 SWE-bench Verified 测试中，GPT-5.2 Thinking 达到 80% 的高分，表现卓越。
长文本处理：在 OpenAI MRCRv2 测试中，GPT-5.2 Thinking 在处理长达 256k tokens 的长文档时，准确率接近 100%，适合深度文档分析。
视觉理解：在 CharXiv Reasoning 和 ScreenSpot-Pro 测试中，GPT-5.2 Thinking 的错误率大幅降低，能更准确地解读图表、界面和视觉报告。
工具调用：在 Tau2-bench Telecom 测试中，GPT-5.2 Thinking 达到 98.7% 的准确率，表现出色，即使在推理强度最低的情况下，性能显著优于 GPT-5.1 和 GPT-4.1。
科学与数学：
- 在 GPQA Diamond 测试中，GPT-5.2 Pro 达到 93.2%，GPT-5.2 Thinking 达到 92.4%，表现卓越。
- 在 FrontierMath 测试中，GPT-5.2 Thinking 解决了 40.3% 的专家级数学问题。
事实准确性：在 ChatGPT 的匿名化查询中，GPT-5.2 Thinking 的错误率比 GPT-5.1 思考降低 30%，显著提升事实准确性。
安全性：在处理自杀、心理健康等敏感话题时，GPT-5.2 的不良响应率显著降低，表现更安全可靠。

如何使用GPT-5.2

在 ChatGPT 中使用 GPT-5.2：GPT-5.2 已于今日起逐步向付费用户（包括 Plus、Pro、Go、Business 和 Enterprise 计划）推出，涵盖 Instant、Thinking 和 Pro 三个版本。为确保流畅性和稳定性，部署将分阶段进行，部分用户可能暂时无法立即使用。在此期间，付费用户仍可在三个月内继续使用 GPT-5.1（旧版模式），之后 GPT-5.1 将逐步下线。用户可根据需求选择适合的版本。
在 API 平台上使用 GPT-5.2：在 OpenAI API 平台中，GPT-5.2 的三个版本已全面开放，具体名称分别为：GPT-5.2 Instant（gpt-5.2-chat-latest）、GPT-5.2 Thinking（gpt-5.2）和 GPT-5.2 Pro（gpt-5.2-pro）。开发者可在 GPT-5.2 Pro 中设置推理参数， GPT-5.2 Pro 和 GPT-5.2 Thinking 均支持新的第五级推理难度xhigh，适用对质量要求极高的任务。通过 API，用户能灵活集成 GPT-5.2 的强大功能，满足复杂的应用场景需求。