OpenAI去年推出的GPT-4在一项由加州大学圣地亚哥分校研究人员进行的实验中,通过了图灵测试。这项测试旨在判断机器是否能模拟出与人类无法区分的智能。在实验中,研究人员邀请500人与包括GPT-4、GPT-3.5、ELIZA在内的人工智能系统和一组人类参与者进行5分钟的对话,然后判断对话对象是人还是机器。
实验结果显示,GPT-4在54%的时间里被误认为是人类,而GPT-3.5在50%的时间里被误认为是人类。相比之下,没有大语言模型或神经网络支持的ELIZA仅在22%的时间里被误认为是人类。尽管GPT-4和GPT-3.5的表现还不及人类参与者67%的平均水平,但根据30%的通过标准,它们都成功通过了图灵测试。
值得注意的是,实验进行时,OpenAI尚未发布能够利用语音、视频和文本信息进行实时推理的新一代旗舰模型GPT-4o。如果该模型参与测试,误认为人类的结果可能会更高。
图灵测试由英国数学家艾伦·图灵在1950年提出。测试流程是由测试者写下问题,并将问题以纯文本形式发送给另一个房间中的一个人与一台机器,测试者根据回答判断哪个是真人,哪个是机器。图灵测试旨在探究机器能否模拟出与人类相似或无法区分的智能。
艾伦·图灵不仅在人工智能领域做出了巨大贡献,他的名字还被用于计算机科学界的最高奖项——图灵奖。该奖项由美国计算机协会(ACM)于1966年设立,旨在奖励对计算机事业作出重要贡献的个人,被誉为“计算机界的诺贝尔奖”。