История создания теста Тьюринга

Английский математик Алан Мэтисон Тьюринг известен, как уникальный специалист в области информатики, вычислительной техники и криптографии. Именно он создал прообраз современного компьютера (вычислительную машину Тьюринга). У ученого было множество других достижений. В конце 40-х годов прошлого века математик начал задаваться вопросом о том, какой электронный интеллект можно считать разумным и сможет ли робот приблизиться к поведению человека настолько сильно, что собеседник не поймет, кто на самом деле находится перед ним. 

Идея создания теста возникла после того, как в Англии стала популярной "Игра в имитацию". Эта модная для того времени забава предполагала участие 3 игроков - мужчины, женщины и судьи, в роли которого мог быть человек любого пола. Мужчина и женщина расходились по разным комнатам и передавали судье записки. По стилю написания и другим признакам судья должен был понять, какие записки принадлежали игроку того или иного пола. Алан Тьюринг решил, что одного из участников можно было бы заменить электронной машиной. Если в процессе электронного дистанционного общения экспериментатор не сможет определить, кто из собеседников - реальный человек, а кто - робот, можно считать, что тест пройден. И это должно стать поводом для признания разумности искусственного интеллекта. 

Прохождение теста

В 1950 году Алан Тьюринг сформулировал систему вопросов, которые могли бы убедить людей в том, что машины умеют мыслить. 
Со временем тест был модернизирован и в качестве объектов тестирования стали чаще выступать не машины, а компьютерные боты. За весь период существования теста его удалось пройти лишь нескольким программам. Но такой успех некоторые специалисты поставили под сомнение. Правильные ответы можно объяснить совпадением и даже в самых лучших случаях программам удалось ответить не более, чем на 60 % вопросов. Полного совпадения достичь так и не удалось. 

Одной из программ, успешно прошедших тест Тьюринга, была "Элиза". Ее создатели наделили искусственный интеллект способностью выделять из речи человека ключевые слова и составлять встречные вопросы. В половине случаев люди не смогли распознать, что общались с машиной, а не с живым собеседником. Некоторые специалисты поставили под сомнение результат тестирования по причине того, что организаторы заранее настраивали испытуемых на живое общение и участвующие в эксперименте даже не догадывались, что давать ответы и задавать вопросы может робот. 

Успешным можно назвать прохождение теста программой, составленной одесситом Евгением Густманом и российским инженером Владимиром Веселовым. Она имитировала личность мальчика в возрасте 13 лет. 7 июня 2014 года состоялось ее тестирование. В нем приняло участие 5 ботов и 30 реальных людей. Только 33 жюри из 100 смогли определить, какие ответы давали роботы, а какие - реальные люди. Такой успех можно объяснить не только хорошо составленной программой, но и тем, что интеллект тринадцатилетнего подростка несколько ниже интеллекта взрослого. Возможно, некоторых жюри ввело в заблуждение данное обстоятельство. 

В пользу противников признания результата говорит и то, что Женя Густман, создавший программу, писал ее на английском языке. Во время тестирования многие судьи списали странные ответы машины или уход от ответов не только на возраст предполагаемого собеседника, но и на языковой барьер. Они посчитали, что робот, которого они приняли за человека, плохо знает язык.

С момента создания теста Тьюринга приблизиться к тому, чтобы успешно его пройти, удалось также программам:

  • "Deep Blue";
  • "Watson";
  • "Parry".

Премия Лебнера

При создании программ и современных роботов специалисты не считают прохождение теста Тьюринга первостепенной задачей. Это всего лишь формальность. Успех новой разработки от результатов тестирования не зависит. Самое главное, чтобы программа оказалась полезной, выполняла определенные задачи. Но в 1991 году была учреждена премия Лебнера. В ее рамках искусственные интеллекты соревнуются между собой в успешном прохождении теста. Предусмотрены 3 категории медалей:

  • золотая (общение с элементами видео и аудио);
  • серебряная (за текстовую переписку);
  • бронзовая (вручается машине, которая в текущем году достигла лучшего результата). 

Золотые и серебряные медали еще не были вручены никому. Бронзовые награды вручаются регулярно. В последнее время заявок на участие в состязании становится все больше, так как создаются новые мессенджеры и чат-боты. У конкурса есть немало критиков. Беглый взгляд на протоколы участников за последние десятилетия показывает, что машину можно легко обнаружить с помощью не очень изощренных вопросов. Наиболее успешные игроки также заявляют о сложности конкурса Лебнера по причине отсутствия компьютерной программы, которая бы могла вести достойный разговор в течение пяти минут. Общепризнанным является факт, что конкурсные приложения разрабатываются исключительно с целью получения малого приза, присуждаемого лучшему участнику года, и на большее они не рассчитаны. 

В настоящее время тест Тьюринга получил несколько современных модификаций:

  • обратный тест Тьюринга (необходимо ввести защитный код для подтверждения того, что пользователь - человек, а не робот);
  • минимальный интеллектуальный тест (предполагает только варианты "да" и "нет" в качестве ответов);
  • мета-тест Тьюринга.

Недостатки теста

Одним из главных недостатков теста считается то, что перед программой ставится задача обмануть человека, запутать его, чтобы заставить его поверить в общение с реальным собеседником. Получается, что признать мыслящим можно того, кто умеет манипулировать, а это можно поставить под большое сомнение. В жизни все происходит несколько иначе. В теории хороший робот должен максимально точно имитировать действия человека, а не запутывать собеседника. Программы, составленные специально для прохождения теста, в нужных местах уклоняются от ответов, ссылаются на незнание. Машины программируют на то, чтобы переписка выглядела максимально естественной. 

Многие ученые считают, что фактически тест Тьюринга оценивает схожесть речевого поведения человека и робота, но не способность искусственного разума мыслить, как это было заявлено создателем. Скептики уверяют, что ориентация на подобное тестирование тормозит прогресс, не дает науке двигаться вперед. В прошлом веке прохождение теста было большим достижением и даже чем-то фантастическим, но в настоящее время способность компьютера "переписываться, как человек", нельзя назвать сверхестественным.