Sunday, November 02, 2014

Dangerous Knowledge - Тест Тьюринга. Часть VII (Russian)

Часть последняя. В предыдущей серии Dangerous Knowledge - Теория меры.

Разумные, подобные человеку, машины на протяжении многих десятилетий были одной из основных тем научно-фантастических произведений. С момента зарождения современной вычислительной техники умы людей занимал вопрос: можно ли построить машину, которая могла бы в чем-то заменить человека.

Алан Тьюринг в работе Computing Machinery and Intelligence в 1950 году предположил, что вопрос разумности машины — слишком сложный и философский, поэтому лежит вне пределов компетенции точных дисциплин.

Философы сознания, психологии в современной неврологии не способны дать определения "интеллект" и "мышление", насколько они являются достаточно точными и вообще применимы к машинам. Без такого определения, в центральных вопросах философии об искусственном интеллекте не может быть ответа. Вместо него британец предложил такое утверждение: если что-то в течение достаточно долгого времени ведет себя как разумное существо, то это существо следует признать разумным.

Ниже есть продолжение.

Тьюринг писал: «Я не хочу создать впечатление, будто я думаю, что у сознания нет никакой загадки. Существует, например, своего рода парадокс, связанный с любой попыткой определить его местонахождение. Но я не думаю, что эти загадки обязательно надо разгадать до того, как мы сможем ответить на вопрос, которому посвящена данная работа».

Проверить это утверждение Алан Тьюринг предложил с помощью теста, который, со временем, стали называть тестом Тьюринга.

Современная версия теста Тьюринга представляет собой следующее задание. Группа экспертов общается с неизвестным существом. Они не видят своего собеседника и могут общаться с ним только через какую-то изолирующую систему — например, клавиатуру. Если в конце эксперимента они не смогут сказать, общались ли они с человеком или с машиной, и если на самом деле они разговаривали с машиной, можно считать, что эта машина прошла тест Тьюринга. Переписка должна производиться через контролируемые промежутки времени, чтобы судья не мог делать заключения, исходя из скорости ответов. Во времена Тьюринга компьютеры реагировали медленнее человека. Сейчас это правило тоже необходимо, потому что они реагируют гораздо быстрее, чем человек.

Исследования в области искусственного интеллекта начались в 1956 году, однако их философские корни уходят глубоко в прошлое. Вопрос, сможет машина думать или нет, имеет долгую историю. Он тесно связан с различиями между дуалистическим и материалистическим взглядами. С точки зрения дуализма, мысль не является материальной (или, по крайней мере, не имеет материальных свойств), и поэтому разум нельзя объяснить только с помощью физических понятий. С другой стороны, материализм гласит, что разум можно объяснить физически, таким образом, оставляя возможность существования разумов, созданных искусственно.

Теория сильного искусственного интеллекта предполагает, что компьютеры могут приобрести способность мыслить и осознавать себя, хотя и не обязательно их мыслительный процесс будет подобен человеческому. Теория слабого искусственного интеллекта отвергает такую возможность.

Возможно ли создание такой машины? Возможно, существует какое-то фундаментальное ограничение на их создание? Если создание такой машины возможно, то сможет ли такая машина мыслить? Может быть она уже создана?

Все перечисленные выше вопросы считаются до сих пор открытыми. Хотя в прошлом и были заявления о том, что тест Тюринга пройден.

Так, в 1966 году была Джозеф Уайзенбаум создал программу Элиза (ELIZA). Принцип работы Элизы заключается в исследовании введенных пользователем комментариев на наличие ключевых слов. Если найдено ключевое слово, то применяется правило, по которому комментарий пользователя преобразуется и возвращается предложение-результат. Если же ключевое слово не найдено, Элиза либо возвращает пользователю общий ответ, либо повторяет один из предыдущих комментариев. Вдобавок Уайзенбаум запрограммировал Элизу на имитацию поведения психотерапевта, работающего по клиент-центрированной методике. Это позволяет Элизе «притвориться, что она не знает почти ничего о реальном мире». Применяя эти способы, программа Уайзенбаума могла вводить в заблуждение некоторых людей, которые думали, что они разговаривают с реально существующим человеком. На этом основании некоторые утверждают, что Элиза — одна из программ (возможно первая), которые смогли пройти тест Тьюринга. Однако это утверждение очень спорно, так как людей, «задающих вопросы», инструктировали так, чтобы они думали, что с ними будет разговаривать настоящий психотерапевт, и не подозревали о том, что они могут разговаривать с компьютером.

В 1972 году Кеннетом Колби создал программу PARRY. Её можно описать как «Элиза с мнениями»: программа пыталась моделировать поведение параноидального шизофреника, используя схожий (если не более продвинутый) с Элизой подход, примененный Уайзенбаумом. Для того чтобы проверить программу, PARRY тестировали в начале 70-х, используя модификацию теста Тьюринга. Команда опытных психиатров анализировала группу, составленную из настоящих пациентов и компьютеров под управлением PARRY, используя телетайп. Другой команде из 33 психиатров позже показали стенограммы бесед. Затем обе команды попросили определить, кто из «пациентов» — человек, а кто — компьютерная программа. Психиатры лишь в 48 % случаев смогли вынести верное решение. Эта цифра согласуется с вероятностью случайного выбора. Эти эксперименты не являлись тестами Тьюринга в полном смысле, так как для вынесения решения данный тест требует, чтобы вопросы можно было задавать в интерактивном режиме, вместо чтения стенограммы прошедшей беседы.

6 июня 2014 года появилось сообщение, что полноценный тест Тьюринга впервые в истории был пройден с помощью программы «Eugene Goostman». Подробности см. в отдельной заметке.

ELIZA и PARRY использовали несовершенство формулировки самого теста. «Евгений Густман» делал то же самое. Во-первых, он притворялся мальчиком, поэтому ответы в духе «Я не знаю» были ожидаемы. Во-вторых, он притворялся украинским мальчиком, то есть английский — язык, на котором велось тестирование — для него не был родным, а, значит, от него можно было ожидать грамматические ошибки. В-третьих, тест длился пять минут, а, в-четвертых, в качестве судей в нём принимали участие непрофессионалы.

Почти все разработанные программы и близко не подошли к прохождению теста. Хотя такие программы, как Элиза (ELIZA), иногда заставляли людей верить, что они говорят с человеком, как, например, в неформальном эксперименте, названном AOLiza, но эти случаи нельзя считать корректным прохождением теста Тьюринга по целому ряду причин:

* Человек в таких беседах не имел никаких оснований считать, что он говорит с программой, в то время как в настоящем тесте Тьюринга человек активно пытается определить, с кем он беседует.
* Документированные случаи обычно относятся к таким чатам, как IRC, где многие беседы отрывочны и бессмысленны.
* Многие пользователи Интернета используют английский как второй или третий язык, так что бессмысленный ответ программы легко может быть списан на языковой барьер.
* Многие просто ничего не знают об Элизе и ей подобных программах, и поэтому не сочтут собеседника программой даже в случае совершенно нечеловеческих ошибок, которые эти программы допускают.

Некоторые из самых известных ИИ-систем:

* Deep Blue — победил чемпиона мира по шахматам. Матч Каспаров против суперЭВМ не принёс удовлетворения ни компьютерщикам, ни шахматистам, и система не была признана Каспаровым. Затем линия суперкомпьютеров IBM проявилась в проектах brute force BluGene (молекулярное моделирование) и моделирование системы пирамидальных клеток в швейцарском центре Blue Brain.

* Watson — перспективная разработка IBM, способная воспринимать человеческую речь и производить вероятностный поиск, с применением большого количества алгоритмов. Для демонстрации работы Watson принял участие в американской игре «Jeopardy!», аналога «Своей игры» в России, где системе удалось выиграть в обеих играх.

* MYCIN — одна из ранних экспертных систем, которая могла диагностировать небольшой набор заболеваний, причем часто так же точно, как и доктора.

* 20Q — проект, основанный на идеях ИИ, по мотивам классической игры «20 вопросов». Стал очень популярен после появления в Интернете на сайте 20q.net.

* Распознавание речи. Системы такие как ViaVoice способны обслуживать потребителей.

* Роботы в ежегодном турнире RoboCup соревнуются в упрощённой форме футбола.

Банки применяют системы искусственного интеллекта (СИИ) в страховой деятельности (актуарная математика), при игре на бирже и управлении собственностью. Методы распознавания образов (включая, как более сложные и специализированные, так и нейронные сети) широко используют при оптическом и акустическом распознавании (в том числе текста и речи), медицинской диагностике, спам-фильтрах, в системах ПВО (определение целей), а также для обеспечения ряда других задач национальной безопасности.

Модификация теста Тьюринга, в которой цель или одну или более ролей машины и человека поменяли местами, называется обратным тестом Тьюринга. CAPTCHA — это разновидность обратного теста Тьюринга. Перед тем как разрешить выполнение некоторого действия на сайте, пользователю выдается искаженное изображение с набором цифр и букв и предложение ввести этот набор в специальное поле. Цель этой операции — предотвратить атаки автоматических систем на сайт. Обоснованием подобной операции является то, что пока не существует программ достаточно мощных для того, чтобы распознать и точно воспроизвести текст с искаженного изображения (или они недоступны простым пользователям), поэтому считается, что система, которая смогла это сделать, с высокой вероятностью может считаться человеком. Выводом будет (хотя и не обязательно), что искусственный интеллект пока не создан.

Существует ли какое-то фундаментальное ограничение на создание сильного искусственного интеллекта?

Сторонники того, что существует такое ограничение обычно ссылаются на тезис Чёрча—Тьюринга и на Теорема Гёделя о неполноте (о последнем есть у меня отдельная заметка).

Для того, чтобы объяснить о чём речь нам понадобится понятие Машина Тьюринга.

Машина Тьюринга (МТ) — абстрактный исполнитель (абстрактная вычислительная машина). Была предложена Аланом Тьюрингом в 1936 году для формализации понятия алгоритма. Здесь, я не буду вдаваться в подробности её построения. Скажу лишь, что это по-сути своей является математической абстракцией, расширением, конечного автомата, однако, существуют многочисленные реализации такой машине на компьютере.

Алан Тьюринг в середине 1930-х годов высказал предположение (известное как Тезис Чёрча-Тьюринга), что любой алгоритм в интуитивном смысле этого слова может быть представлен эквивалентной машиной Тьюринга. Машина Тьюринга способна имитировать все исполнители (с помощью задания правил перехода), каким-либо образом реализующих процесс пошагового вычисления, в котором каждый шаг вычисления достаточно элементарен.

Физический тезис Чёрча—Тьюринга гласит: Любая функция, которая может быть вычислена физическим устройством, может быть вычислена машиной Тьюринга.

Уточнение представления о вычислимости на основе понятия машины Тьюринга (и других эквивалентных ей понятий) открыло возможности для строгого доказательства алгоритмической неразрешимости различных массовых проблем (т.е. проблем о нахождении единого метода решения некоторого класса задач, условия которых могут варьироваться в известных пределах). Простейшим примером алгоритмически неразрешимой массовой проблемы является так называемая проблема применимости алгоритма (называемая также проблемой остановки). Она состоит в следующем: требуется найти общий метод, который позволял бы для произвольной машины Тьюринга (заданной посредством своей программы) и произвольного начального состояния ленты этой машины определить, завершится ли работа машины за конечное число шагов, или же будет продолжаться неограниченно долго...

Тезис Чёрча—Тьюринга — фундаментальное утверждение для многих областей науки, таких, как теория вычислимости, информатика, теоретическая кибернетика и др. Его, однако, невозможно строго доказать или опровергнуть так как он оперирует неформальным понятием "алгоритм в интуитивном смысле".

Итак, согласно тезису Чёрча—Тьюринга, "все что интуитивно нам кажется, может быть вычислено, может быть формализировано с помощью машины Тюринга". Не смотря на то, что в рамках этой заметки я не привожу деталей, смею вас заверить, что описание машины Тьюринга является математической моделью. Верно также, что на машине Тюринга можно сделать все арфифметические вычисления.

...В 1931 году молодой австриец Курт Гёдель доказал, что в любом нетривиальном языке (языке достаточно богатом, чтобы допускать формулировку результата классической арифметики) есть утверждения которые не возможно ни доказать, ни опровергнуть. Как было показано в предыдущем параграфе, машина Тьюринга является примером такого языка. Проблема остановке, в этом смысле, является примером утверждения, которое на машине Тюринга нельзя ни доказать ни опровергнуть. Таким образом, это является аргументом в сторону невозможно создания искусственного интеллекта.

Следует, однако, иметь в виду, что ни в коем случае, не является сколько-нибудь строгим "доказательством" невозможности создания искусственного интеллекта. Во-первых, наше построение опирается на недоказуемый тезис Чёрча—Тьюринга, во-вторых, мы довольно вольно применяем теорему Гёделя о неполноте. Не понятно, как из-за того, что существуют утверждения алгоритмически неразрешимые на машине Тьюринга, следует, что невозможно создать искусственный интеллект.

Сила и привлекательность теста Тьюринга исходит из его простоты. Тест Тьюринга, даже если и несовершенен, но по крайней мере, обеспечивает то, что это действительно может быть измерено. Как таковой, это является прагматическим решением трудных философских вопросов, часть из которых я описал выше.

См. также:
Dailymotion. Видео. Часть I
Dailymotion. Видео. Часть II
Dailymotion. Видео. Часть III
Dailymotion. Видео. Часть IV
Dailymotion. Видео. Часть V

Полное содержание:
Dangerous Knowledge
Dangerous Knowledge - Бесконечное множество и интуиция.Часть I
Dangerous Knowledge - Парадокс брадобрея. Часть II
Dangerous Knowledge - Диагональный метод доказательства Кантора. Часть III
Dangerous Knowledge - Континуум-гипотеза. Часть IV
Dangerous Knowledge - Аксиома выбора. Часть V
Dangerous Knowledge - Теория меры. Часть VI
Dangerous Knowledge - Тест Тьюринга. Часть VII


Игорь Клейнер. Универсальные стадии любви?

Матч на первенство мира по шахматам

Дата проведения 7.11.2014 - 28.11.2014

12 партий

Матч на первенство мира проводится в Сочи с 7 по 28 ноября. Согласно регламенту чемпион мира Магнус Карлсен (Норвегия) и претендент, экс-чемпион мира Вишванатан Ананд (Индия) должны сыграть 12 партий с контролем времени 120 минут на 40 ходов, затем 60 минут на 20 ходов и 15 минут до конца партии с добавлением 30 секунд на каждый ход, начиная с 61-го.
После 6-й партии происходит перемена цвета (участник, у которого были белые в 1-й партии, играет 7-ю черными).

В случае ничейного исхода матча проводится тай-брейк: 4 партии с контролем времени 25 минут + 10 секунд на ход. Если счет остается равным, то играются 2 партии с контролем 5 минут + 3 секунды на ход, и далее при необходимости еще 4 блицматча из 2 партий. Если 10 партий не выявят победителя, то играется решающая партия, в которой белые имеют 5 минут, черные – 4, с добавлением 3 секунд после 61-го хода, ничья в пользу черных.

Игровые дни: 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 25 ноября. Выходные: 10, 13, 16, 19, 22, 24, 26 ноября.
Тай-брейк: 27 ноября.
http://chesspro.ru/tournaments/carlsen_anand14