Meta超级智能实验室联合佐治亚理工学院和IBM研究院的研究团队在2025年10月2日发表了一项关于大语言模型安全对齐的重要研究成果。这项名为"通过缺陷思维让大型推理模型学会更好的对齐"的研究由彭胜云、埃里克·史密斯、伊万·埃夫季莫夫等研究者共同完成 ...