图灵测试,最初由艾伦·图灵于1950年称为模仿游戏,是对机器表现出与人类相当或无法区分的智能行为能力的测试。
图灵提出,人类评价者将对人类和设计成产生类似人类反应的机器之间的自然语言对话进行判断。评估者将意识到对话的两个伙伴之一是一台机器,所有的参与者将彼此分开。对话将被限制在一个纯文本的渠道上,如电脑键盘和屏幕,所以结果将不取决于机器将文字呈现为语音的能力。如果评估者不能可靠地分辨出机器和人类,就可以说机器通过了测试。测试结果并不取决于机器对问题给出正确答案的能力,而是取决于它的答案与人类给出的答案有多接近。该测试是图灵在曼彻斯特大学工作时,于1950年在其论文《计算机器与智能》(Computing Machinery and Intelligence)中提出的。其以这样的话语开篇。“我提议考虑一个问题,'机器能不能思考?由于“思考”难以定义,图灵选择“用另一个与之密切相关并以相对不含糊的语言表达的问题来取代这个问题。”图灵用一个叫做 "模仿游戏 "的三人游戏来描述这个问题的新形式,在这个游戏中,一个审讯者向另一个房间里的一男一女提问,以确定这两个玩家的正确性别。图灵的新问题是:"是否有可以想象的数字计算机在模仿游戏中表现良好?"图灵认为,这个问题实际上是可以被回答的。在论文的其余部分,他反驳了对 "机器可以思考 "这一命题的所有主要反对意见。自从图灵提出他的测试以来,其测试既具有很大的影响力,又受到广泛的批评,并成为人工智能哲学中的一个重要概念。它的一些批评,如约翰·塞尔的中文房间,本身也存在争议。