如果只看全球大模型榜单,2024—2025 的行业几乎呈现出一种“趋同结构”。参数集体跃升、跑分全面对齐,产品节奏越来越像硅谷发布会:你更新,我跟进。你标榜通用智能,我也把重点落在“更像 GPT”上。越往后看,这场技术竞赛似乎正在走向一条单行线。 但 ...
【新智元导读】星星之火,可以燎原!证明的尊严在于可验证;这一次,GPT-5让数学证据落在了代码里。 一雪前耻,ChatGPT为OpenAI「正名」! 被Hassabis吐槽太尴尬之后,GPT-5真启发了新的数学结论。 OpenAI的科学家Sebastien Bubeck高调宣扬GPT-5破解了十道Erdős难题。
Gemini 3.0 Pro「马甲」上线! 谷歌的Gemini 3.0疑似上线LMArena!众多实测提前曝光,但效果嘛,很难评。 Gemini 3.0传了这么久,终于还是露出「马脚」了。 依然还是LMAreana竞技场,Gemini 3.0的两个「马甲」被扒了出来。 这已经是「传统艺能」了,每次新模型上线,都要 ...
人工智能真是日新月异。早上看到网友的评论:我们已经 0 天没有吸引注意的 AI 领域新突破了。 记得三个月前,OpenAI 官宣了他们的推理模型在国际数学奥林匹克(IMO)竞赛中获得了金牌。 现在看,大模型不仅仅在数学领域具有很强的推理泛化能力,也在很多 ...