Если два компьютера играют в шахматы

Люди проигрывают искусственному интеллекту на собственной территории — компьютеры уже выигрывают у нас в шахматы, го, покер и даже Dota 2. Мы составили краткий обзор таких противостояний и попробовали разобраться, какие прикладные задачи могут решать игровые алгоритмы в будущем.

В 1914 году испанский инженер и математик Леонардо Торрес-и-Кеведо, который изобрел одну из первых систем радиоуправления, представил шахматный автомат. Он был достаточно примитивным и умел разыгрывать только эндшпиль — финальную стадию партии — но ни один из мастеров того времени не смог выиграть у автомата Торреса.

Начавшаяся в том же году Первая, а вскоре после нее и Вторая мировые войны остановили дальнейшие разработки. Следующий важный этап для искусственного интеллекта наступил только в 1955 году — тогда и появился сам термин «искусственный интеллект». Его придумал американский ученый Джон Маккарти, а через три года он создал язык программирования Lisp, который стал основным в работе с ИИ.

В 1956 году другой инженер Артур Сэмюэл создает первый в мире самообучающийся компьютер, который играет в шашки. Сэмюэл выбрал именно шашки из-за элементарных правил, которые при этом требуют определенной стратегии. Компьютер обучался на простых гидах по игре, которые можно было купить в магазине. В них описывались сотни партий с хорошими и плохими ходами. Через три года Сэмюэл ввел понятие машинного обучения.

Интересный факт: в 1966 году Джозеф Вейценбаум представил Элизу, первого в истории чат-бота. Элиза могла говорить на английском на любые темы. Вейценбаум разработал ее, чтобы сымитировать прием у психотерапевта. Он специально выбрал сложную ситуацию, в которой многое опирается на умение слушать и распознавать главное в репликах собеседника — компьютер того времени этого не мог. Разработчик таким образом хотел показать, насколько ненатуральным будет общение человека и компьютера, но при тестах оказалось, что люди испытывали в разговоре с Элизой чувства и эмоции, как с полноценным собеседником.

В 1985 году университет Карнеги-Меллон начал разработку ChipTest, компьютера для игры в шахматы. В 1988 к проекту присоединилась IBM и прототип переименовали в Deep Thought. Через год его решили проверить в деле и пригласили Гарри Каспарова, который без труда победил в обеих играх.

В 1995 IBM представила Deep Thought II, который позже назвали Deep Blue, сделав отсылку к прозвищу компании, Big Blue. Через год состоялся первый матч Каспарова и улучшенного компьютера. Человек снова выиграл: в шести партиях Каспаров три раза победил и один раз проиграл, два матча закончились вничью.

Еще через год, в мае 1997, сильно улучшенный Deep Blue одержал в ответном матче две победы, один раз проиграл и трижды сыграл вничью, став первым компьютером, выигравшим у действующего чемпиона мира по шахматам.

Уже в начале 2000-х компьютеры стабильно выигрывали у мировых чемпионов, и шахматы стали первой игрой, в которой люди уступили компьютерам.

Разработчики искусственного интеллекта начали искать новый вызов в более сложных и непредсказуемых играх, для которых нужны более комплексные алгоритмы. После победы Deep Blue астрофизик из университета Принстона заявил, что «пройдет 100 лет перед тем, как компьютер сможет обыграть человека в го — может, даже больше». Ученые приняли вызов и начали разрабатывать машины для этой игры с простыми правилами, в которой тем не менее очень сложно стать мастером.

Первые компьютеры, которые действительно могли составить конкуренцию человеку, появились только в этом десятилетии. В 2014 году Google DeepMind представила алгоритм AlphaGo, который два года соревновался с людьми на равных, но одержал первую значимую победу только в октябре 2015, одолев чемпиона Европы.

Через год на популярном азиатском сервере Tygem, где играют и мировые чемпионы, появился пользователь под ником Master. За несколько дней он провел 60 матчей и ни разу не потерпел поражения, чем вызвал возмущения и подозрения в нечестной игре. 4 января 2017 года Google раскрыла, что все это время под ником скрывалась улучшенная версия AlphaGo.

В мае 2017 AlphaGo — все тот же, который прославился в сети под ником Master — сразился с Кэ Цзе, первым игроком го в мировом рейтинге, и победил в трех матчах из трех, а уже в октябре Google DeepMind выпустила версию, которая была мощнее Master. AlphaGo Zero самообучался вообще без участия человека, просто бесконечно играя сам с собой. Через 21 день он достиг уровня Master, а через 40 уже был лучше всех предыдущих версий.

В декабре 2017 вышел AlphaZero, еще более мощный вариант AlphaGo Zero. Он смог стать лучше предшественника за 8 часов, одновременно достигнув уровня гроссмейстера в шахматах. Так го стала второй игрой, в которой люди больше не могут выиграть.

Го и шахматы подчиняются строгим правилам, и тренировка искусственного интеллекта в них — дело времени. Но есть игры, в которых человеческий фактор выходит на первый план. Например, покер — во многом психологическая игра, построенная на эмоциях, неверабальной коммуникации, умении блефовать и распознавать блеф.

В 2017 году, после более чем 10 лет попыток и неудач, две команды независимо друг от друга разработали свои модели ИИ, способные обыграть профессионалов в покер. Университет Альберты представил DeepStack, нейросеть, обладающую искусственной формой интуиции, а исследователи уже знакомого университета Карнеги-Меллон показали Libratus AI. Нейросеть за 20 дней провела 120 тысяч игр против профессионалов, которые собирались каждый вечер, чтобы обсудить возможные лазейки и недоработки в Libratus. Каждый игровой день анализировала и нейросеть, совершенствуясь по его итогам.

Меньше чем за месяц Libratus выиграла у профессионалов $1,7 млн (пока что виртуальных), а один из участников эксперимента так описал свои впечатления: «Это как играть с кем-то, кто видит все твои карты. Я не обвиняю нейросеть в нечестной игре, просто она действительно настолько хороша».

В 2015 году Илон Маск и Сэм Альтман, президент Y Combinator, основали компанию OpenAI, чтобы создать открытый и дружественный искусственный интеллект.

В 2017 году в рамках эксперимента команда разработчиков решила натренировать свою нейросеть в Dota 2 — игре, в которой две команды по пять человек сражаются друг с другом, используя множество комбинаций более сотни героев. У каждого из них есть свой набор навыков, а игроки могут собирать предметы для усиления персонажа. Это крупнейшая игра в современном киберспорте.

За две недели нейросеть смогла обучиться и победить нескольких лучших игроков мира в режиме один на один, и сейчас ее создатели готовятся выпустить версию для основного режима, пять на пять.

В начале 2018 алгоритмы от Alibaba и Microsoft превзошли человека в тесте на понимание прочитанного текста.

В марте 2018 года небольшой робот собрал кубик Рубика за 0,38 секунды. Рекорд среди людей — 4,69 секунды.

В мае 2018 искусственный интеллект стал лучше людей распознавать рак кожи.

По данным опроса более чем 350 экспертов в области искусственного интеллекта, скоро алгоритмы смогут победить нас в любой игре, через 10 лет научатся водить лучше нас, а к 2050 году будут проводить операции точнее нас.

Сами же исследователи, создав нейросети, которые за несколько дней достигают сверхчеловеческих способностей в играх, теперь пытаются найти им применение в реальной жизни. Google DeepMind использует AlphaGo Zero для исследования сворачивания белка, пытаясь найти лекарство от болезней Альцгеймера и Паркинсона.

«Наша конечная цель — использовать прорывы вроде AlphaGo для решения всех видов насущных проблем в реальном мире», — говорит Демис Хассабис, СЕО компании. «Если такие алгоритмы можно применить и в других ситуациях, как, например, изучение сворачивания белка, снижение уровня потребляемой энергии, или создание новых революционных материалов, то это сильно продвинет вперед все человечество и положительно скажется на наших жизнях».

Искусственный интеллект активно идет и в бизнес — не только в лабораториях Google, но и в российских компаниях: «Тинькофф» использует искусственный интеллект для одобрения кредитов, а «Газпромбанк» распознает улыбки клиентов с помощью компьютерного зрения.

Оба компьютера могут просчитать все варианты до конца партии. Достаточно ли белым, которые имеют право первого хода для выигрыша всей партии?

Это просто неизвестно. Шахматы - не крестики-нолики, и доказать, будет ли в таком случае ничья или выигрыш белых, пока никто не смог и не скоро еще сможет.
По моему опыту игры в шахматы, скорее будет ничья, но это чисто мое впечатление. Лучше спросить мнение гроссмейстеров, но и это ничего не докажет.

"Шахматы - не крестики-нолики" - проще только с доказадельством поставленной задачи.

А вот сосчитать варианты там "посложнее" будет (на бесконечном поле) - бесконечное число вариантиков получится.

Случайные числа сделают свое дело. Компьютерные шахматные программы устроенны так, что оцениваются ходы и выбирается наиболее выгодный. Но при равенстве баллов за ход выбор хода случайный. Поэтому при большом числе партий общий счет будет стремиться к ничьей по чмслу партий. А при малом числе партий - результат трудно предсказать.

Alexandr A Просветленный (30885) Не совсем так. Попадалась мне статья на этот счет. Обычно просчитвают не все, а несколько тысяч лучших ходов. Но даже если просчитать все, может оказаться пару десятков равноценных в той ситеме оценок и настроек, которая принята для данной программы. И тут выбор все таки случайный. Компьютер противник оступает точно так же, но у него могут быть другие коеффициенты. Другой компьютер их не знает, и учесть не может. Именно игра настроек и выбор ходов в итоге и определит исход встречи. Именно так и было, когда компьютер обыграл Каспарова. Основные контраргументы сводились к тому, что программа заточена именно под стиль Каспарова, и с такими настройками она могла проиграть игроку послабее, но с другой тактикой. Так что все упирается в математику и выбор варианта из множества других.

По поводу просчета ходов до конца - считается что в шахматах 10 в 120 степени ходов, даже суперкомпьютеру для этого нужно много времени. В реальных партиях обычно установлен лимит времени, так что просчет до конца вряд ли возможен.
В условиях без ограничения времени - да, но такие партии никому не интересны.

дополню.. много партий начинается ходом пешки от короля, но исход встречи совершенно непредсказуем.
Например в игре Го противнику дается фора в 5.5 камней, а в шахматах фора первого хода крайне мизерная. Все решается в процессе игры.

александр амелькин Мудрец (14339) Вы берёте практический компьютер и практическую партию, с лимитом времени. Я же беру вымышленный компьютер, который мгновенно может просчитать ВСЕ варианты. То есть, каждый ход можно подписать: "выигрывающий ход", "проигрывающий ход", "ничейный ход". Надеюсь Вы не сомневаетесь что всего 3 вида ходов. Например, нас 3 выигрывающих хода, 5 ничейных ходов, остальные 14 ходов проигрывающие. Так вот, в начале партии у белых есть выигрывающие ходы, или они могут появиться только в результате ошибки черных. А так, в начале партии у белых только ничейные и проигрывающие ходы?

Да так-то оно так. Но в голове не умещается. Неужели такое маленькое преимущество и при таком огромном числе вариантов достаточно для победы?

". алгоритма развития стратегии в шахматах. " - га- га - га. стратегий в шахматах не бывает.

тем более "алгоритма развития".

Сами то поняли, что сказали? (шутка)

Михаил Кузин Просветленный (45761) В ШАХМАТАХ, как в военной науке, существует стратегия дебюта, миттельшпиля и эндшпиля игры. Чем скорее заняты выгодные для боевых действий позиции, тем успешнее перспективы всей кампании. Алгоритм развития шахматных фигур заключается в успешном выдвижении, взятии под контроль большего количества полей (клеток) и блокировании фигур противника. Например, кто первый произвел рокировку, тот быстрее объявит мат противнику.

"Оба компьютера могут просчитать все варианты до конца " - в таком случае шахматы раз и навсегда перестанут быть игрой. -а только "списком вариантов", абсолютно бессмысленном (бесполезным) .

По логике - очевидно, что если бы разрешалось пропускать ход, то черным не выиграть- максимум - ничья.

А так - всего 20 вариантов начала для белых и по каждому из них - "ответ" - чем кончится ( итог партии от суперкомпа, кстати, хватит одного. ) . Тут могут быть разные варианты.

Если первый ход белых конем туда и обратно сможет передать инициативу проигрыша черным - тогда только ничья.. . ( черные тоже начнут ходить конем туда- обратно)

Так что - суперкомпьютер - "в студию"! Тогда и узнаем.

Я имею ввиду, что с самого начала к каждому ходу можно прикрепить бирку: "выигрывающий ход", "проигрывающий ход", "ничейный ход". Так вот, в самом начале партии у белых есть однозначно выигрывающие ходы, или они могут появиться только в результате ошибки чёрных?

AMS Мудрец (13244) "ошибки чёрных?" - это исключается, если все варианты просчитаны до конца! Термин "ошибка" становится бессмысленным. Вместо него - ваша "бирка". ( я утрирую, см. ниже) Бирку на "ход" не наклеить, так как за каждым ходом будет множество вариантов продолжений - МНОГО бирок! Поэтому суммарную бирку "выигрывающий ход" может быть можно повесить на те первые ходы, которые хотя бы одним из вариантов ведут к гарантированной победе. Но, никто не доказал, что такое решение возможно. Но может быть круче ситуация - кто начинает - тот и проигрывает. Как доказать невозможность такого? Там все очень запутано может оказаться. Уж очень "ветвистое" дерево вариантов

Нет, программа никогда не содержит расчётов до самого конца партии. Программа всегда содержит оценку позиции. Именно на этом и основан быстрый выигрыш при игре с обычными компьютерами. Поэтому суперкомпьютеры с разными программами обязательно будут и выигрывать и проигрывать разными цветами. Но, конечно, выигрывать больше белыми. Чёрным всё-таки очень туго, особенно сейчас с современным развитием теории.

"программа никогда не содержит расчётов до самого конца партии":

Игорь, вопрос по сути был о том, что будет, если суперкомп СОСЧИТАЕТ все варианты до конца! Их же конечное (счетное) множество. ( сосчитать нужно будет только один раз и навсегда - шахматы перестанут быть игрой. )

Игорь Елкин Просветленный (49554) число 10 в степени 50 превышает количество атомов во Вселенной. Попробуйте посчитать число возможных первых 10 ходов - (наверно) их больше. Не будет таких компьютеров.

если программа едина, всегда будет ничья.
совершенная программа играя с идеальной, будет обязана подключать чувства, чувств бесконечность, что бы определить победителя, условно, нужно будет блокировать чувства.
совершенная программа не блокирует, ибо знает. что блокирует самого себя, короче говоря, не будет заниматься уродливыми делами.
она получает кайф не от того что её назовут победителем, а от жизни с бесконечными вариантами, где проигравший=победитель, ибо организм един.

20 лет назад действующий чемпион мира по шахматам Гарри Каспаров проиграл в шести партиях компьютеру Deep Blue, и с тех пор машины в шахматах было уже не остановить. Они становились все сильнее, и теперь любой смартфон с нужной программой может обыграть даже гроссмейстера. Так шахматисты стали одними из первых людей в мире, которым в профессии нужно работать не только на компьютерах, но и вместе с компьютерами. Что это означает и почему это важно именно сейчас, читайте в материале «Чердака».

11 мая 1997 года на Гарри Каспарове, одном из сильнейших игроков в истории шахмат, был синий костюм в мелкую белую клеточку, кремовая рубашка и темный широкий галстук с полосками в цвет сорочки. Напротив него сидел один из программистов команды IBM и переставлял шахматные фигуры по указаниям суперкомпьютера Deep Blue, занимавшего два больших шкафа. Это была битва машины и человека. У Каспарова — блокнот, ручка и взволнованный взгляд, у компьютера — 480 процессоров. Впервые в истории компьютер одолел действующего чемпиона мира по классическим шахматам: это была последняя, шестая, партия матча, в котором Deep Blue победил с суммарным счетом 3 ½ — 2 ½ .

После той игры Каспаров был в гневе. Еще в 1988 году он заявлял, что как минимум до 2000 года компьютеры не смогут конкурировать с шахматными гроссмейстерами. Позже, когда в 1994 году немецкая программа Fritz 3 выиграла партии у Владимира Крамника, Вишванатана Ананда и других гроссмейстеров, это лишь скорректировало его мнение: Каспаров был уверен, что перед его творческой игрой бездушная машина не устоит. В 1996 году, сразу после первого матча с Deep Blue (его Каспаров выиграл со счетом 4—2), он снисходительно писал в журнале Time: «Хотя я и заметил признаки интеллекта, у компьютера все-таки была неэффективная и негибкая манера игры».

Но в мае 1997 года все пошло не так. Первую партию против компьютера Каспаров уверенно выиграл, но уже во второй он по ошибке сдался в стопроцентно ничейной позиции. В трех следующих партиях гроссмейстер выходил из дебюта с явным перевесом над Deep Blue, но потом машина идеально защищалась от всех атак и игры сводились к ничье. В шестой, решающей, партии Каспаров пошел на риск: он подставлял компьютер под позиционную жертву ферзя, но был уверен, что машина не будет отдавать фигуру только ради неочевидного стратегического перевеса. Авантюра не сработала — на восьмом ходу Deep Blue отдал ферзя и уже на девятнадцатом Каспаров сдался. Это было самое быстрое поражение в его карьере.

После игры шахматные эксперты спорили, какой именно ход стал решающей ошибкой гроссмейстера, а Каспаров требовал распечаток с ходами и обвинял IBM в обмане: по его мнению, важнейшие ходы компьютеру подсказывал человек. Но все это уже не могло поменять главного: 11 мая 1997 года компьютер обыграл действующего чемпиона мира по шахматам.

Как работал Deep Blue

Deep Blue родился из другого шахматного компьютера — Deep Thought, который с середины 80-х годов практически без официального финансирования разрабатывали аспиранты университета Карнеги-Меллон. К началу 90-х их проект сильно продвинулся. В 1989 Deep Thought выиграл чемпионат мира по шахматам среди компьютеров, а к лету 1990 года он побеждал уже примерно в половине игр с гроссмейстерами и в 90% игр с мастерами международного класса. После этих успехов программистов переманил к себе IBM — так начался проект Deep Blue.

В основе обоих компьютеров лежат примерно одни и те же подходы. Главный из них — минимаксный алгоритм. Каждый ход компьютер строит дерево следующих ходов: он перебирает все свои возможные действия и после каждого из них оценивает положение на доске, потом перебирает все ответные ходы соперника и оценивает уже их перспективы. После этого компьютер продолжает анализ: он смотрит, как можно ответить на ходы противника, и так повторяется до тех пор, пока не закончится время, отведенное на принятие решения. В конце компьютер выбирает тот ход, который в конечном счете приведет к наилучшему положению (отсюда слово «макси» в названии алгоритма) при оптимальной игре соперника (отсюда слово «мини» — компьютер всегда идет по ветви дерева, где соперник делает худший для компьютера ход).

Чемпион мира Гарри Каспаров во время матча с Deep Blue 1997 год. Фото: Илона Колесниченко / ИТАР-ТАСС

Каждый ход в шахматах у игрока есть примерно 30 вариантов действий. За один ход черными и белыми набегает около 900 вариантов развития событий (30*30), за два — примерно 810 000, а за восемь число вариантов уже превышает количество атомов во Вселенной. Конечно, перебрать все эти ходы абсолютно невозможно. Поэтому создатели Deep Blue оптимизировали алгоритм, чтобы он отсекал лишние варианты: во время перебора программа запоминает лучший ход, а те ветви, которые заведомо не могут привести к более выгодной позиции, — игнорирует.

Но даже такие уловки не помогают ни Deep Blue, ни другим компьютерам просчитать всю партию до конца. Поэтому в компьютерных шахматах многое завязано на вычислительной мощности: чем больше операций в секунду совершает компьютер, тем дальше в партию он может заглянуть. В максимальной конфигурации Deep thought работал на шести процессорах и просчитывал не более двух миллионов позиций за секунду, у Deep Blue в матче с Каспаровым было 480 процессоров, и он управлялся с 330 миллионами позиций. Каждый ход он заглядывал вперед в среднем на три своих шага и три шага противника. Этого оказалось вполне достаточно для победы.

Впрочем, без людей тоже не обошлось. Кроме программистов в команде IBM был гроссмейстер Джоэл Бенжамин. Он играл пробные партии с Deep Blue, отлавливал ошибки алгоритма, оптимизировал его оценку позиции (в конечной версии для этого использовалось более 8000 разных характеристик вроде количества фигур на доске) и составлял дебютную книгу компьютера (первые ходы алгоритм не просчитывал возможности на доске, а разыгрывал одну из наиболее подходящих случаю комбинаций, записанных в его архив). Так что в каком-то смысле Каспаров был прав: машине подсказывал человек, но не во время партии.

Deep Blue и современные компьютерные шахматы

После своей победы полная версия Deep Blue больше не сыграла ни одного официального матча и со временем была сдана в музей IBM, но другие шахматные компьютеры становились все совершеннее. Программисты использовали возможности своего железа все лучше и лучше, и в результате машины стали заметно сильней даже самых лучших гроссмейстеров. В ноябре—декабре 2006 года Deep Fitz разгромила другого действующего чемпиона, Владимира Крамника, со счетом 4—2, и этот матч стал последним громким шахматным соревнованием между человеком и машиной.

Дальше соревноваться с компьютерами было уже почти бессмысленно — они стали слишком сильными.

У шахматистов есть рейтинг Эло, основанный на статистике личных встреч. Согласно нему, сила Каспарова на пике его формы оценивалась в 2851 балл, и это почти самый высокий рейтинг в истории шахмат. Больше было только у нынешнего чемпиона, норвежца Магнуса Карлссена, — 2882 балла, но эти цифры не идут ни в какое сравнение с 3341 баллами у Stockfish — самой сильной шахматной программы современности, которая даже на мощностях смартфона может обыграть гроссмейстера.

Сейчас профессиональные шахматисты очень много используют компьютеры в своей работе. С помощью них они разбирают сыгранные партии, ищут ошибки и анализируют игру будущих соперников. Былое пренебрежение к компьютерным шахматам давно забыто.

Цифровые кентавры

Шахматы традиционно считаются атрибутом ума, и поэтому поражение Каспарова выглядело грандиозным событием в истории компьютеров: никто четко не понимал, что такое искусственный интеллект, но было очевидно, что машины обошли людей в одном из аспектов интеллектуального поведения.

В новых условиях, обещавших тревожные перспективы сознательных машин, быстрей всего сориентировался сам Каспаров: не зря интеллект — это еще и способность приспосабливаться к изменениям.

Уже в июне 1998 года он сыграл первый в истории матч в «продвинутые» (advanced) шахматы, где друг против друга выступают не просто живые люди, а пары человек—компьютер: соперником Каспарова и его искусственного помощника стал болгарский гроссмейстер Веселин Топалов, тоже «усиленный» компьютером.

Матч закончился со счетом 3—3 — немного разочаровывающий результат для Каспарова, который тогда в классических шахматах был сильнее болгарина, но зато в этот раз Каспаров остался доволен взаимодействием с компьютером. Он назвал матч весьма впечатляющим опытом и даже сравнил адванс (сокращенное название продвинутых шахмат) с «Формулой-1», где гонщикам нужно не только филигранно пилотировать, но и в совершенстве знать свой болид.

С годами адванс становился все популярнее — собирались команды, проводились чемпионаты. И формула успеха, выдвинутая Каспаровым, становилась все очевиднее: на соревнованиях раз за разом побеждали не маститые шахматисты с высокими рейтингами Эло, а скромные любители, отлично ладящие с компьютерными помощниками.

Так шахматисты стали одними из первых «цифровых кентавров». Им пришлось учиться не просто работать на компьютерах, чтобы лучше играть с живыми соперниками, но и работать вместе с компьютерами, чтобы играть партии в адванс. Пожалуй, свободней в таком сотрудничестве должны себя чувствовать только авиапилоты, которые берут на себя управление самолетом только при взлете, посадке и в экстренных ситуациях.

В прошлом году компьютерам сдался еще один интеллектуальный бастион. Программа AplhaGo, разработанная одной из дочерних компаний Google, победила человека в го — древнюю китайскую игру, где количество вариантов ходов множится еще быстрей, чем в шахматах. Машина обыграла одного из лучших игроков, южнокорейца Ли Седоля.

У программы были принципиально другие алгоритмы, чем у Deep Blue. АlphaGo работает на самообучающихся нейронных сетях, которые способны, к примеру, сами — без ручных установок тренеров — на основе огромной статистики партий постепенно понимать, какие позиции на доске выгодны, а какие нет.

Кроме победы в го нейронные сети за последние два года научились неплохо справляться со многими другими интеллектуальными и творческими задачами, которые традиционно считались под силу только человеку. Теперь они сочиняют стихи и рассказы, пишут музыку и рисуют картины в стилях известных художников, а на очереди стоит медицинская диагностика.

Это немного пугает. Одни боятся за свою работу, другие предчувствуют неминуемую машинную деградацию искусства, третьи вообще предрекают победу искусственного интеллекта над человеческим уже в планетарных масштабах, но пример с Deep Blue может немного остудить этот футурологический пыл. Шахматы (и шахматисты) еще живы — они только немного перестроились. Научились жить и работать бок о бок с машинами.

Гарри Каспаров

Сейчас у человека нет никаких шансов против приличной шахматной программы – обыграть компьютер можно, лишь прыгая по уровням сложности.

Но еще 20 лет назад все было иначе: человек на равных сражался с машиной и даже побеждал – за счет творческого подхода и неординарных ходов.

Переломным оказался 1997 год – лучший шахматист мира Гарри Каспаров уступил компьютеру Deep Blue.

Хотя не обошлось без теории заговора.

Deep Blue больше никогда не играл в шахматы. А по его матчу с Каспаровым даже поставили пьесу

Матч Каспарова против Deep Blue поджег интерес к шахматам – за поединком следил весь мир.

Гроссмейстер, отойдя от болезненного поражения, предложил IBM реванш, а на кон ставил чемпионский титул, но компания ожидаемо отказалась – благодаря победе над чемпионом мира акции IBM устремились вверх. Новый успех уже не повлиял бы на котировки, зато поражение могло испортить ситуацию.

После матча в Нью-Йорке Deep Blue никогда не участвовал в официальных матчах – ни против людей, ни против других машин. Сейчас один из блоков компьютера хранится в Музее компьютерной истории в Калифорнии, второй – в Национальном музее Американской истории в Вашингтоне. Платы остались в исследовательском центре IBM.

Каспаров позже садился за стол против других компьютеров: в январе 2003-го разошелся миром с программой Deep Junior, а в ноябре участвовал в мачте с использованием 3D-технологии против программы Fritz (и снова ничья). Дальше Гарри не играл с машинами на публику, а через пару лет завершил карьеру.

После него шахматисты несколько лет сражались с программами, но с каждым разом все с меньшими шансами на победу. Последней точкой стало поражение чемпиона мира Владимира Крамника в конце 2006-го программе Deep Fritz (2:4).

Интерес к противостоянию людей и машин пропал, когда шансов против компьютера уже не осталось. Сейчас подготовку гроссмейстера не представить без компьютера, но игра на результат с ним бесполезна: рейтинговый рекорд действующего чемпиона мира Магнуса Карлсена составляет 2882 пункта, а сильнейшая шахматная программа набрала 3534. Для сравнения: разрыв между Карлсеном и 100-м номером шахматного рейтинга – всего 213.

В 2003 году вышел документальный фильм Game Over: Kasparov and the Machine. Первое поражение чемпиона мира в матче с компьютером привлекло внимание и поп-культуры: в 2013-м в Нью-Йорке поставили театральную пьесу «Машина» по мотивам поединка. В том же году Disney приобрела права на экранизацию этой пьесы.

Благодаря сериалу Netflix «Ход королевы» шахматы снова в топе обсуждений у массового зрителя.

Карпов или Каспаров? 35 лет главному спору шахмат: играли без флагов, матч обрывали – а Гарри протестовал уже тогда

Дальше последовали три ничьи – к последней партии человек и компьютер подошли с равными шансами: 2,5:2,5. Deep Blue играл белыми, а Каспаров пошел ва-банк – выбрал нетипичный для черных дебют. Поражение случилось уже на 19-м ходу – самое быстрое в его карьере.

После матча Каспаров был в ярости – снова утверждал, что компьютеру помогали гроссмейстеры, иначе странную игру в первых партиях не объяснить. IBM даже получила от чемпиона мира запрос расшифровки отдельных ходов.

«После невероятного напряжения того матча, которое усугублялось подозрительным поведением IBM и моей склонностью к сомнениям, я не был готов легко признать поражение. Честно говоря, я никогда не умел проигрывать. Человек, который легко смиряется с поражением, никогда не станет настоящим чемпионом, и этот принцип, конечно, справедлив и в моем случае. Но я верю в честную борьбу. Тогда же я считал, что IBM обманула меня – а также весь мир, пристально следивший за нашим матчем», – писал Каспаров в книге «Человек и компьютер: Взгляд в будущее».

По одной из версий, именно эмоции помешали Гарри выиграть. После нестандартных ошибок в первых партиях он переоценил машину и начал ее бояться. В книге «Сигнал и шум» журналиста The New York Times Нейта Силвера один из создателей Deep Blue Мюррей Кэмпбел объяснил ошибку в первой партии обычным багом.

То, что Каспаров принял за дальновидность (а потом – за человеческий фактор), оказалось ошибкой в программе. По условиям матча разработчики вносили изменения в код компьютера, поэтому баг исправили после первой же партии. Вот только чемпион мира об этом не знал и напряженно ждал непредсказуемых ходов.

«Каспаров решил, что неожиданная игра была признаком высшего интеллекта. Он никогда не думал, что дело – просто в сбое. Машина не проявляла упорства не потому, что видела новый вариант развития партии, а всего лишь из-за того, что в проигрышной ситуации делала выбор случайным образом – компьютеру все равно, на каком ходу закончится партия, если вариантов для победы нет. А Каспаров не просчитал этот вариант», – объяснял Кэмпбел.

Гроссмейстер еще долго не мог смириться с поражением. Появлялись разные объяснения: недостаток подготовки, начало политической деятельности (в книге «Мой шахматный путь» Каспаров писал, что весной помогал генералу Александру Лебедю). Конечно, досталось и IBM:

«Я столкнулся с могучим противником, обладающим неограниченными ресурсами, который поставил перед собой задачу любой ценой выиграть матч у Каспарова. При этом IBM одновременно является спонсором, арбитром, организатором. IBM дала мне понять, что идет война. При этом весь военный антураж они контролировали от начала до конца. Все, что находилось в этом здании, принадлежало IBM, оплачивалось IBM. И если отвлечься от необъяснимых моментов в игре машины, то человеку в таких условиях очень трудно нормально сосредоточиться. Я так и не смог настроиться на нормальный матч».

Спустя годы Гарри поменял мнение, согласившись, что был частью важнейших перемен. Он принял результат матча, а будущее видел уже не в противостоянии человека и машины, а в их сотрудничестве.

«Ход королевы» – неожиданный претендент на сериал года: о гениальной шахматистке, наркотиках и одиночестве

Гарри Каспаров

Владимир Крамник

Магнус Карлсен

Сергей Карякин

Заключительная статья из цикла о противостоянии Каспарова с шахматными машинами.

Матч с X3D стал последним сражением Гарри Кимовича с машиной – больше он никогда не играл с компьютерами публично. Впрочем, и его соперничество с людьми тоже продолжалось недолго. Пару лет он ещё играл в обычных турнирах, но в 2005 году решил завершить свою шахматную карьеру. Отныне шахматы стали для него всего лишь хобби. После ухода Каспарова, в шахматах не осталось явного лидера.

На протяжении нескольких лет шахматную корону оспаривало сразу несколько примерно равных по силе гроссмейстеров. Но в 2013 году на вершину поднялся молодой норвежец Магнус Карлсен. Сегодня он чемпион мира и безусловный лидер мировых шахмат. Между тем матчи людей и машин продолжались. В 2004-05 годах в Испании состоялись два матча ведущих гроссмейстеров против лучших шахматных программ. Оба закончились победой команды машин, со счетом 3½:8½ и 4:8.

В ходе второго матча состоялась также последняя на текущий момент, победа человека над одной из топ-программ при классических условиях игры. Честь столь специфического достижения выпала на долю гроссмейстера Руслана Пономарева, который смог воспользоваться оплошностью программы Дип Фриц 9.

Летом 2005 года в Лондоне состоялся матч между гроссмейстером первой мировой десятки Майклом Адамсом и шахматной машиной Гидра (на фото слева). Традиционно, игралось шесть партий. Матч закончился со счетом 0½:5½ в пользу машины. Всё что смог добиться человек в матче - это одна ничья.

И наконец, заключительным аккордом противостояния людей и машин стал матч чемпиона мира Владимира Крамника и шахматной программы Дип Фриц 10 в конце 2006 года. Снова победа машины – 4:2.

Несмотря на какие-то надежды переломить ситуацию, постепенно становилось понятно, что дни противоборства человека с машиной сочтены. По мере совершенствования алгоритмов и железа преимущество компьютеров проявлялось все более и более заметно.

После поражения Крамника, матчи людей с машинами — по крайней мере в классическом формате — прекратились. Общественный интерес к ним практически иссяк. С тех пор если и удавалось организовать подобные матчи, то только в «бюджетном» варианте. Размеры призового фонда упали с нескольких сотен до пары тысяч долларов.

Матчи теперь проводились с укороченным контролем времени, часто против не самых сильных шахматистов. Нередко человеку давалась фора, или же выделялся в помощь более слабый компьютер. С этого момента шахматные программы перестали быть соперником для людей, и постепенно перешли в разряд аналитических инструментов.

На фото – Владимир Крамник играет с программой Дип Фриц 10.

Как и у людей, состав сильнейших программ тоже постепенно менялся. В конце 2005 года на смену «заслуженным» чемпионам старой волны – Джуниору, Фрицу, Шреддеру и другим, пришел новый фаворит – программа Рыбка.

Она намного обогнала конкурентов во всех рейтинг-листах и на протяжении пяти лет никто не смог оспорить её превосходство. С каждой новой версией она все больше и больше прибавляла в силе.

В конце 2010 года на вторые роли Рыбку отодвинул Гудини, став новым, очевидным лидером среди программ. Продержавшись на самом верху мировой табели о рангах около трех лет, он в свою очередь уступил место ещё более сильным конкурентам.

С 2014 года лучшими в мире считаются сразу две программы – Комодо и Стокфиш. В настоящее время они входят в аналитический арсенал практически всех ведущих гроссмейстеров. Стоит еще отметить, что в отличие от коммерческого Комодо, Стокфиш – это программа с открытым исходным кодом. А значит просмотреть её код, или даже просто наблюдать за процессом её совершенствования, может каждый.

Между тем, уровень современных программ продолжает быстро расти и предела их совершенству пока не видно. Но вернемся к вопросу противостояния людей и машин. Могут ли сильнейшие гроссмейстеры обыгрывать лучшие шахматные программы сегодня? Как уже упоминалось выше, нормальные матчи между людьми и компьютерами давно не проводятся, так что судить об этом можно только по косвенным признакам. В первую очередь, это конечно рейтинг. Современные программы уже более чем на 500 пунктов сильнее тех, что играли когда-то с Каспаровым и другими гроссмейстерами. Причем, даже без учета прогресса по части вычислительной техники.

Следует правда иметь в виду, что по результатам многолетних тестов, прирост рейтинга у машин слегка опережает человеческий – где-то в соотношении 5:4 или 4:3. Тем не менее, запас прочности современных программ настолько велик, что лучшие из них сейчас как правило без всякого труда выигрывают у тех программ, оборону которых в свое время безуспешно пытались взломать такие шахматные гиганты как Гарри Каспаров и Владимир Крамник.

Играя против когда-то «заслуженных» Фрицев и Джуниоров, современные программы легко приумножают даже совсем незначительный перевес, и без проблем доводят его до победы. В общем, посредством старых программ и рейтингов можно сделать вполне определенный вывод относительно силы игры современных машин.

Но, помимо рейтингов и матчей программ, несомненно важным является мнение и самих гроссмейстеров. По крайней мере тех, из них, кто в настоящее время постоянно играет в турнирах или занимается тренерской или аналитической работой. Без шахматных программ сегодня не обходится ни один серьезный анализ на «высшем уровне» и ведущие шахматисты (не как программисты конечно, но как пользователи), могут поведать о поведении программ очень многое:

Владимир Тукмаков, международный гроссмейстер:

…В общении шахматиста с машиной был заведомый лидер – человек, который задавал направление поиска, а программа, послушно следуя указаниям лидера, только вносила коррективы и уточнения. Но в последние годы это соотношение драматическим образом и необратимо изменилось. Теперь уже ЖД взял на себя роль жреца и поводыря, оставляя белковому существу возможность практически использовать рекомендации высшего разума.

Сергей Шипов, международный гроссмейстер:

Программы в конце первого десятилетия нового века стали уже намного сильнее людей — лучших из лучших — и это не подвергается сомнениям среди профессионалов. Каждый из нас использует лучшие программы в домашнем анализе, мы их знаем, как родных. Даже лучше… Современные программы (в первую очередь Рыбка и Гудини) обладают удивительно сбалансированной и человечной оценочной функцией. Они уже не такие жадные, как программы 90-х. Тонко чувствуют инициативу, грамотно работают с пешечной структурой, учитывают все важные стратегические факторы… В общем, десятилетия упорной работы программистов и профессиональных шахматистов прошли не зря. Они совместно создали почти идеальных игроков, намного превосходящих нас, живых людей. Это факт.

Сергей Карякин, международный гроссмейстер:

…Я иногда сражаюсь с программой «Гудини» и могу сравнивать. В поединке против компьютера тебя не покидает чувство обреченности…

Возможен ли матч человек — машина сегодня? Каким он может быть? Давайте попробуем оценить варианты подобного соревнования. Во-первых, следует отметить, что разного рода легкие партии проводятся и в наши дни. А вот для серьезного матча нужен солидный призовой фонд, который вряд ли возможен при современном общественном интересе.

Но даже если оставить в стороне финансовые вопросы, то в вероятном матче человеку придется давать какую-то фору – по времени или по материалу. Иначе он вряд ли согласится играть. Фора по материалу (речь конечно идет о топ-гроссмейстерах) скорее всего выльется в одну-две пешки, или их разменный эквивалент из других фигур.

К сожалению, на размер материальной форы, по-видимому не слишком влияет сила игры лучших современных программ. Что естественно делает бессмысленным сравнение этих программ с людьми. Можно, в свою очередь, давать фору не по материалу, а скажем за счет уменьшения времени машины.

Но чтобы современная программа сбавила в силе до уровня компьютеров первой половины 2000-х, потребуется выставить ей около 1 секунды на ход на хорошем современном смартфоне. Подобного рода «подгонка» силы соперников в общем-то лишает смысла само соревнование между человеком и машиной. В лучшем случае мы определим, сколько форы по времени необходимо, чтобы соперники и в самом деле уравнялись в силах. И только.

Какие же есть еще варианты? Отсутствие у компьютера дебютной книги человеку поможет мало, так как машины и без нее играют сильно. От удаления эндшпильных таблиц выигрыш будет ещё меньше.

Повторение ходов из предыдущих партий в основном исключено, вследствие заметной «рандомности» сопутствующей шахматным программам на многоядерных системах. Если же давать в помощь человеку слабую программу, то сразу встает вопрос, насколько велика роль машины в результатах человека.

В общем, трудно представить себе какие-то очевидные и интересные формы игры с компьютерами сегодня. Подводя итоги, можно сказать что время громких матчей людей и машин окончательно ушло в прошлое. Компьютер сегодня не соперник, а помощник людей. Под влиянием машин, да и не только их, современные шахматы постепенно меняются. К чему это приведет, предстоит увидеть нам с вами.

Каспаров возвращается спустя 12 лет. И это большой сюрприз

Над машиной работали не только программисты, но и шахматисты. Спаррингом компьютера и разработчиком дебютной книги был американский гроссмейстер Джоэл Бенджамин, позже к нему присоединились другие профессионалы.

Первый матч между Каспаровым и обновленным Deep Blue прошел в 1996-м. Турниру благодаря IBM выделили щедрый призовой фонд: 500 тысяч долларов, из которых победителю доставалось 400. Формально партии проходили в Филадельфии, хотя компьютер находился в Нью-Йорке, а ходы за него делал оператор, получивший сигнал онлайн. На случай проблем со связью IBM привезла две резервные машины с чуть меньшей мощностью.

Первая партия завершилась сенсационной победой Deep Blue – впервые в истории компьютер выиграл у чемпиона мира партию с классическим контролем времени. Но Каспаров быстро отыгрался, без особых проблем сведя матч к победе – 4:2 в пользу человека.

Радостный Каспаров после матча хвалил IBM, но уже не был так категоричен в отношении его перспектив:

«Впервые в истории человечества мы имеем что-то очень близкое к искусственному интеллекту. Уже есть возможность уменьшить число ошибок и достичь уровня игры, который определяется интуицией человека. Сейчас – там где я интуитивно чувствую, играю ли я правильно или ошибочно, – машина просто перебирает миллиарды и миллиарды вариантов. Но не исключено, что в дальнейшем удастся создать алгоритм, который был бы сравним с интуитивным мышлением человека».

Создатели компьютера согласились с Каспаровым и предложили ему реванш через год.

Реванш: машина победила, но Гарри считал, что ей помогали гроссмейстеры

Второй матч Каспарова и Deep Blue назначили на май 1997-го.

Разработчики оперативно правили ошибки, делая мысли машины более гибкими, а к работе привлекли нового топ-гроссмейстера Мигеля Ильескаса. Ожидалось, что Каспаров выберет антикомпьютерную тактику – нестандартные решения и неожиданные ходы.

Матч проходил на 35-м этаже нью-йоркского небоскреба Equitable Building. В этот раз Каспарова и Deep Blue разделяли не километры, а несколько стен – компьютер из двух блоков находился в отдельном помещении. Призовой фонд вырос до 1,1 млн – 400 тысяч получал уже проигравший, а не победитель, как год назад.

IBM поработала и над пиар-составляющей матча: пригласила журналистов, организовала трансляцию и отдельный зрительный зал.

Регламент сохранился – 6 партий за 6 дней. Каспаров начал белыми и выиграл – компьютер оказался не готов к нестандартному подходу человека. В конце партии машина грубо ошиблась: вместо того, чтобы продлить партию еще на десяток ходов, пришла к безнадежной позиции намного быстрее.

Но уже во второй партии Каспаров, уверенный, что компьютер просчитывает дальновидные схемы, в какой-то момент остановил партию и поздравил машину с победой. Оказалось, что Гарри переоценил возможности машины: атакующий маневр, с которым он смирился, машина просто не видела, а значит, партия легко сводилась к ничьей. В этом момент чемпион мира заподозрил владельцев в махинациях, обвинив IBM в том, что компьютеру помогает живой человек, а связка машина-гроссмейстер превосходит даже лучшего шахматиста мира в несколько раз.

«Я думал, раз машина, которая так сильно провела всю партию, уверенно делает ход, значит, она видит, что вечный шах черные объявить не могут. И не стал проверять. А ничья там была! Вот у меня и возникло подозрение: больно уж некомпьютерная ошибка. Элементарный человеческий зевок», – сетовал Каспаров в интервью «Коммерсанту» после матча.

Каспаров не верил, что компьютер может его обыграть (сначала так и было)

В 1997-м Каспаров был главным шахматистом планеты. Он еще не ушел в политику, обладал титулом чемпиона мира по версии Профессиональной шахматной ассоциации (ПША) и часто представлял человечество в играх против шахматных программ.

Еще в 1989-м Каспаров легко выиграл две блиц-партии у суперкомпьютера Deep Thought, пообещав, что машина никогда не обыграет человека в шахматы.

«Если компьютер сможет превзойти в шахматах лучшего из лучших, это будет означать, что ЭВМ в состоянии сочинять лучшую музыку, писать лучшие книги. Не могу в это поверить. Если будет создан компьютер с рейтингом 2800, то есть равным моему, я сам сочту долгом вызвать его на матч, чтобы защитить человеческую расу», – уверял Гарри.

В первой игре с Каспаровым Deep Thought находился на шахматном уровне в 2552 пункта – далеко до рейтинга чемпиона мира. На помощь искусственному разуму пришел компьютерный гигант IBM, предложивший сотрудничество команде Deep Thought. Проект начинался как диссертационная работа в университете Карнеги-Меллон, а со временем перерос в подготовку первой машины, способной бороться с чемпионом на равных.

IBM поменяла название шахматной программы с поэтичного Deep Thought (Глубокая Мысль), навеянного романом Дугласа Адамса «Автостопом по галактике», на Deep Blue. Причина была проста – носившая неофициальное название Big Blue компания решила увековечить себя в названии шахматного компьютера.

Разработчики постоянно наращивали скорость машины, параллельно совершенствуя программное обеспечение. Работа компьютера основывалась на переборе всевозможных действий после хода соперника и просчете вариантов ответных ходов до тех пор, пока есть время на принятие решения.

Чтобы выстраивать так называемое древо ходов, машина перебирала миллионы вариантов – для этого требовалась максимально высокая скорость. Deep Thought просчитывал около 700 тысяч позиций в секунду, а усовершенствованная версия Deep Blue 1997-го – уже до 200 млн позиций.

Читайте также: