OpenAI 发布了新一代人工智能模型 GPT-5,在多项能力上取得显著进步,引发业界热议。本文将介绍 GPT-5 的新特性、性能提升以及行业评价,探讨它是否真的实现了从 “高中生” 到 “博士” 的跨越。

北京时间8月8日凌晨,OpenAI正式发布新模型GPT-5。此时,距离GPT-4的发布已经过去两年多。
据OpenAI官网介绍,这是迄今为止该机构推出的最强大的人工智能系统,在各类基准测试中超越了先前的模型,在编程、数学、写作、健康、视觉感知等方面都具备业界领先的性能,在减少幻觉(错误生成)、提升指令执行能力、降低“逢迎”倾向方面都有重大进展。

版本发布后,业界声音各异,有人认为,“没有令人眼前一亮的表现,有些小失望。”也有自媒体大V表示,“GPT-5不只是升级,而是一次质的飞跃。”较为中立的科技媒体如此点评:“相比于其他版本,它确实更好,但没有掀起革命。”
01 从高中生到博士?
本次发布的模型版本共有四个,包括GPT-5、GPT-5 mini、GPT-5 nano,以及只对企业版和每月200美元高级版开放的GPT-5 Pro。此外,该模型有三大核心组件:一是智能高效模型(GPT-5 Main),能回答大多数日常问题;二是深度推理模型(GPT‑5 Thinking),能力有所升级,可以解决更为复杂的问题;三是实时决策选择器,可根据对话类型、问题复杂性、工具需求及用户指令来动态判断调用哪一个模型。
“GPT-3就像和一个高中生谈话,GPT-4像和一个大学生说话,实现了真正的智能和高效。但现在的GPT-5,就像一位博士级别的专家,任何你需要的领域,皆可以帮助你实现目标。”发布会现场,OpenAI CEO萨姆·奥尔特曼(Sam Altman)打起了比方。
“当我在一周内被诊断出患有三种癌症时,我和家人完全慌了,报告内的医学术语又深奥难懂,不知所措之下,我率先想到的第一件事是把报道截图放进GPT,让它来帮我理解。”
在演示环节,OpenAI强调了GPT-5在健康建议、代码生成、写作这3类典型使用场景中的表现。一位用户现场回忆起了自己的经历:几秒钟后,该模型将报告翻译成了通俗易懂的语言,并且为她是否需要做放射治疗的决定作出“走心”的指引。
[fancyad id=”45″]
HealthBench Hard基准测试显示,GPT-5在各类医学问答中的正确率远超前几代模型,此外,表达更清晰、条理性也更强。“我认为AI在医疗领域的前景不仅在于突破性的发现或者更好地协助诊断,而是可以充分参与并引导病人进行治疗。”OpenAI工作人员表示。
“GPT‑5是我们迄今为止最好的编码模型,它能帮助每个人,甚至是不知道如何编写代码的人将想法变为现实。”其中一名工作人员进行了现场演示:GPT-5在不到3分钟时间里就写了超200行代码。

从OpenAI的演示中还可以看到,与之前的模型相比,在写作方面,GPT-5能更好地帮助用户润色草稿、邮件乃至故事,“AI味”有所减少。《IT时报》进行了体验,抛出的问题是:假设你是一家初创公司的战略顾问,公司计划推出一款“智能垃圾分类回收箱”(带AI识别、自动称重、积分兑换功能),目标市场是老旧小区。请帮我分析:相比传统回收箱和人工回收,这款产品的核心竞争力应如何设计才能打动小区物业和居民?

该模型从竞争对手的痛点、老旧小区的现实情况、核心竞争力的设计思路、落地策略、绘制对比图等方面进行分析。虽然回答的内容多数在预料之中,不过其上下文的条理性较为清晰,维度也比较全。

《IT时报》尝试询问GPT-5“9.11和9.9谁大”这一经典题目,从回答中可以看到,GPT-5的智商确有提升,最后给了一个正确答案——9.9更大。但是,GPT-5的表现并不稳定,有时会答错。
02 从GPT-3到GPT-5
5年前,GPT-3的出世开创了人机交互的全新时代。它的前身GPT于2018年发布,包含1.17亿个参数,次年发布的GPT-2包含15亿个参数。彼时,GPT-3的主要突破是不再需要针对特定任务进行微调编码,模型会自主调整。在规模方面,GPT-3达到1750亿参数,是其前身的116倍。
2023年3月发布的GPT-4是一个多模态模型,和上一代相比,其能接受图像和文本的双向输入输出。而后,业界就开始期待GPT-5的到来,不过一等就是两年多的时间。
“确实更强,但并不颠覆。”科技产业智库“甲子光年”的一篇发文显示,GPT-5带来的整体感受,与两位参与早期测试的工程师此前对路透社的评价接近。据有关媒体早前报道,GPT-5在编码和科学问题解决上的能力令人印象深刻,但从GPT-4到GPT-5的提升,远不如2023年GPT-3到GPT-4的进步。
“我们正在沿着指数级技术进步的长弧线攀登,它总是向前看是垂直的,向后看是平坦的。”今年6月,奥尔特曼的一篇博客文章《温和的奇点》(The Gentle Singularity)引发热议,他谈到对未来的设想:2025年,能够进行真正认知工作的代理系统将出现;
2026年,能够提出新颖见解的系统可能会出现;2027年,能够在现实世界中执行任务的机器人可能会出现。到2030年,很可能与以往任何时期都截然不同,智能、能源、创意,以及实现创意的能力将变得异常丰富,有了丰富的智力和能源,以及良好的管理,理论上可以拥有任何其他东西。
从现阶段来看,GPT-5所引起的反响水花不大,伴随而来的一个问题是——GPT下一步的演进方向是什么?
作者【IT时报】,微信公众号:【IT时报】