玩酷网

【天风证券:GPT5在幻觉和诚实上取得大突破】GPT-5在性能上普遍优于GPT4

【天风证券:GPT5在幻觉和诚实上取得大突破】GPT-5在性能上普遍优于GPT4和o3/o4系列,在性能/成本上全面提高,同时幻觉率看到快速下降,看好AI应用的产业机会。GPT-5是由多个模型和实时路由机制组成的同一系统。GPT-5 是一个整合多模型的统一系统,包含快速响应的基础模型(gpt-5-main、gpt-5-main-mini)、深度推理模型(gpt-5-thinking、gpt-5-thinking-mini),以及实时路由机制。路由模块根据对话类型、复杂度、工具需求等动态选择模型,并通过用户交互数据持续优化。模型主要依靠Azure AI训练完成。GPT-5性能提升的同时在减少幻觉/提升指令遵循上取得突破 (1)GPT-5在性能上普遍优于GPT4和o3/o4系列,目前榜单上各项能力都排名第一

(2)在幻觉和诚实上,GPT-5取得较大突破幻觉率是应用尤其是B端应用的巨大痛点;在ChatGPT启用网络搜索完成某任务后,GPT-5的响应包含事实错误的可能性比GPT-4 o低约45%,在思考模式,GPT-5的响应包含事实错误的可能性比OpenAI o3低约80%;整体幻觉率从5%等级降低到不足1%;GPT-5这一代思考模型比慢思考模型幻觉率大幅下降(之前都是慢思考模型幻觉率更高);此外在诚实度上提升较多欺诈减少,欺诈率从o3的4.8%降低到2.1%