时隔两年多，OpenAI发布GPT-5，从高中生跃升为博士？

111 0 0

OpenAI 发布了新一代人工智能模型 GPT-5，在多项能力上取得显著进步，引发业界热议。本文将介绍 GPT-5 的新特性、性能提升以及行业评价，探讨它是否真的实现了从 “高中生” 到 “博士” 的跨越。

北京时间8月8日凌晨，OpenAI正式发布新模型GPT-5。此时，距离GPT-4的发布已经过去两年多。

据OpenAI官网介绍，这是迄今为止该机构推出的最强大的人工智能系统，在各类基准测试中超越了先前的模型，在编程、数学、写作、健康、视觉感知等方面都具备业界领先的性能，在减少幻觉（错误生成）、提升指令执行能力、降低“逢迎”倾向方面都有重大进展。

版本发布后，业界声音各异，有人认为，“没有令人眼前一亮的表现，有些小失望。”也有自媒体大V表示，“GPT-5不只是升级，而是一次质的飞跃。”较为中立的科技媒体如此点评：“相比于其他版本，它确实更好，但没有掀起革命。”

01 从高中生到博士？

本次发布的模型版本共有四个，包括GPT-5、GPT-5 mini、GPT-5 nano，以及只对企业版和每月200美元高级版开放的GPT-5 Pro。此外，该模型有三大核心组件：一是智能高效模型（GPT-5 Main），能回答大多数日常问题；二是深度推理模型（GPT‑5 Thinking），能力有所升级，可以解决更为复杂的问题；三是实时决策选择器，可根据对话类型、问题复杂性、工具需求及用户指令来动态判断调用哪一个模型。

“GPT-3就像和一个高中生谈话，GPT-4像和一个大学生说话，实现了真正的智能和高效。但现在的GPT-5，就像一位博士级别的专家，任何你需要的领域，皆可以帮助你实现目标。”发布会现场，OpenAI CEO萨姆·奥尔特曼（Sam Altman）打起了比方。

“当我在一周内被诊断出患有三种癌症时，我和家人完全慌了，报告内的医学术语又深奥难懂，不知所措之下，我率先想到的第一件事是把报道截图放进GPT，让它来帮我理解。”

在演示环节，OpenAI强调了GPT-5在健康建议、代码生成、写作这3类典型使用场景中的表现。一位用户现场回忆起了自己的经历：几秒钟后，该模型将报告翻译成了通俗易懂的语言，并且为她是否需要做放射治疗的决定作出“走心”的指引。

[fancyad id=”45″]

HealthBench Hard基准测试显示，GPT-5在各类医学问答中的正确率远超前几代模型，此外，表达更清晰、条理性也更强。“我认为AI在医疗领域的前景不仅在于突破性的发现或者更好地协助诊断，而是可以充分参与并引导病人进行治疗。”OpenAI工作人员表示。

“GPT‑5是我们迄今为止最好的编码模型，它能帮助每个人，甚至是不知道如何编写代码的人将想法变为现实。”其中一名工作人员进行了现场演示：GPT-5在不到3分钟时间里就写了超200行代码。

从OpenAI的演示中还可以看到，与之前的模型相比，在写作方面，GPT-5能更好地帮助用户润色草稿、邮件乃至故事，“AI味”有所减少。《IT时报》进行了体验，抛出的问题是：假设你是一家初创公司的战略顾问，公司计划推出一款“智能垃圾分类回收箱”（带AI识别、自动称重、积分兑换功能），目标市场是老旧小区。请帮我分析：相比传统回收箱和人工回收，这款产品的核心竞争力应如何设计才能打动小区物业和居民？

该模型从竞争对手的痛点、老旧小区的现实情况、核心竞争力的设计思路、落地策略、绘制对比图等方面进行分析。虽然回答的内容多数在预料之中，不过其上下文的条理性较为清晰，维度也比较全。

《IT时报》尝试询问GPT-5“9.11和9.9谁大”这一经典题目，从回答中可以看到，GPT-5的智商确有提升，最后给了一个正确答案——9.9更大。但是，GPT-5的表现并不稳定，有时会答错。

02 从GPT-3到GPT-5

5年前，GPT-3的出世开创了人机交互的全新时代。它的前身GPT于2018年发布，包含1.17亿个参数，次年发布的GPT-2包含15亿个参数。彼时，GPT-3的主要突破是不再需要针对特定任务进行微调编码，模型会自主调整。在规模方面，GPT-3达到1750亿参数，是其前身的116倍。

2023年3月发布的GPT-4是一个多模态模型，和上一代相比，其能接受图像和文本的双向输入输出。而后，业界就开始期待GPT-5的到来，不过一等就是两年多的时间。

“确实更强，但并不颠覆。”科技产业智库“甲子光年”的一篇发文显示，GPT-5带来的整体感受，与两位参与早期测试的工程师此前对路透社的评价接近。据有关媒体早前报道，GPT-5在编码和科学问题解决上的能力令人印象深刻，但从GPT-4到GPT-5的提升，远不如2023年GPT-3到GPT-4的进步。

“我们正在沿着指数级技术进步的长弧线攀登，它总是向前看是垂直的，向后看是平坦的。”今年6月，奥尔特曼的一篇博客文章《温和的奇点》（The Gentle Singularity）引发热议，他谈到对未来的设想：2025年，能够进行真正认知工作的代理系统将出现；

2026年，能够提出新颖见解的系统可能会出现；2027年，能够在现实世界中执行任务的机器人可能会出现。到2030年，很可能与以往任何时期都截然不同，智能、能源、创意，以及实现创意的能力将变得异常丰富，有了丰富的智力和能源，以及良好的管理，理论上可以拥有任何其他东西。

从现阶段来看，GPT-5所引起的反响水花不大，伴随而来的一个问题是——GPT下一步的演进方向是什么？

作者【IT时报】，微信公众号：【IT时报】

# 行业动态

文章版权归作者所有，未经允许请勿转载。

OpenAI DevDay：语言取代操作系统，Altman 构建 AI 时代的生态垄断

人人都是产品经理

在政务领域，如何打造一个“能干活”的AI Agent？

人人都是产品经理

讲给产品经理的AI技术指南：用Dify彻底搞懂RAG、Agent和微调

人人都是产品经理

狂刷2亿播放，副业月入2万！又一隐秘赛道爆火

人人都是产品经理

爆肝亲测：4款国产AI PPT神器红黑榜，看完省下10小时加班

人人都是产品经理

全球95%企业AI惨败？MIT报告引硅谷恐慌！90%员工偷用ChatGPT续命

人人都是产品经理

时隔两年多，OpenAI发布GPT-5，从高中生跃升为博士？

01 从高中生到博士？

02 从GPT-3到GPT-5

GPT-5 来了

GPT-5发布的真相：搞钱，比AGI更重要

相关文章

相关文章