谷歌DeepMind团队在最新论文中介绍了创新的生成式验证器GenRM,通过创造性的奖励模型设计,显著提升了生成式AI的推理能力。GenRM在多个推理任务中的表现优于传统验证器和现有的大语言模型验证方法。