时令 发自 凹非寺
量子位 | 公众号 QbitAI
这一次,“不会”竟成了大模子的高光时刻。
天然在IMO第6题上得了零分,OpenAI的金牌模子却展现了“高武艺的老诚”。
正如OpenAI接洽员oam Brown在最新访谈中所揭示的:
当IMO推理模子会在短少有用凭据时暗示“我省略情”,这会显赫减少遁入乖张。
在AI摘下IMO金牌后,OpenAI金牌小分队成员Alex Wei、Sheryl Hsu和oam Brown参与了红杉老本组织的一场对话,揭秘模子攻克精英数学难题的底层冲破。
有网友帮衬回首了个太长不看版:
与昔日那些“看起来圆善,实则乖张”的幻觉式谜底不同,这一代大模子启动学会“承认我方不会”。
它绚丽着模子正在从胡编乱造的幻觉式回报,转向愈加可靠且具有“自我认融会”的全新阶段。
三位成员还在这场对话中,共享了更多对于冲刺IMO的真谛细节。
IMO金牌模子能承认我方不知谈尽管数学家与规划机科学家一致认同IMO金牌模子的价值。
但他们无间仇怨,当模子遭遇常识盲区时,它总会输出一个令东谈主确信但乖张的谜底。
他们不得不耗尽无数元气心灵逐行验算,才能甄别那些幻觉陷坑。
IMO第6题让大模子一网尽扫,天然,OpenAI也对其进行了无数规划。
有一个由2025×2025个单元正方形组成的网格。Matilda但愿在网格上放弃一些矩形图块,这些图块的大小不同,但每个图块的每一条边齐位于网格线上,况且每个单元正方形最多被一个图块笼罩。
网格的每一行和每一列齐偶合有一个未被任何瓷砖笼罩的单元正方形,求出Matilda需要放弃的最少瓷砖数目。
天然干涉海量算力最终仅得到一句“我无法回报”令东谈主有些失望,但Alex Wei暗示:
能看到模子幸免产生幻觉是很好的。
oam Brown也对模子的这一滑变暗示称赞,“如若它不知谈,它就会承认它不知谈。”
这代表模子启动具备“自我融会”。
这种“自我融会”不错匡助模子在面临贫苦问题时,承认我方的窝囊为力,而不是生成一个看似合理实则乖张的贬责有规划。
真谛的是,在Alex Wei 2024年刚加入OpenAI一周时,Noam Brown就曾问过他,团队何时能得回IMO金牌。
其时Alex Wei觉得2025年不太可能达成。
但令东谈主赞叹的是,这个三东谈主团队仅用了两月,就完成了他们一直在追求的规划——IMO金牌。
oam Brown还暗示:
OpenAI有一个很棒的场合,便是接洽东谈主员有很大的自主权去作念他们觉得有影响力的接洽。
Alex还强调,他们的团队“委果优先磋商通用手艺”,而不是成心建设用于数学竞赛的系统。
OpenAI IMO金牌中枢团队OpenAI IMO中枢团队仅由三名接洽东谈主员组成。
Alex Wei,本硕均就读于哈佛大学,随后在加州大学伯克利分校得回规划机科学博士学位。
Alex还曾在谷歌、微软和Meta实习,后于2024年1月加入OpenAI,现任接洽科学家。他曾是FAIR团队成员,参与建设了首个用于社买卖戏的东谈主类级东谈主工智能——CICERO。
Sheryl Hsu,毕业于斯坦福大学规划机科学专科,是斯坦福AI执行室中IRIS执行室的接洽员,于2025年3月加入OpenAI。
oam Brown,本科就读于好意思国罗格斯新泽西州立大学新布朗斯维克分校,随后在卡内基·梅隆大学获硕士和博士学位。他曾任职于DeepMind和Meta,于2023年6月加入OpenAI。
参考贯穿:[1]https://x.com/chatgpt21/status/1950606890758476264[2]https://www.youtube.com/watch?v=EEIPtofVe2Q
— 完 —
量子位 QbitAI · 头条号签约
关怀咱们开yun体育网,第一时候获知前沿科技动态