Кто сильнее в шахматах компьютер или человек

На написание этого обзора натолкнул пост «Секрет древней игры го. Почему компьютер до сих пор не обыграл человека?», опубликованный 25 мая. В самом посте, и, тем более, в комментариях, было много сказано по поводу компьютерных шахмат вообще и матча Deep Blue — Каспаров (1997) в частности. Понятно, что сейчас, спустя уже без малого двадцать лет, мало кому интересны все подробности того матча: компьютеры развиваются с колоссальной скоростью, современные смартфоны легко дадут фору компьютерам того времени, да и возможно, сами шахматы несколько утратили популярность последнее время — по каким причинам — это уже тема отдельного разговора.

Впрочем, некоторые подробности, судя по всему, действительно неизвестны, а подробности эти таковы, что заголовки о “падении последнего интеллектуального бастиона” — не более, чем газетный прием, ибо случившийся по итогам матча, по сути, скандал, в силу своей шахматной специфичности вряд ли был бы интересен широкой публике. Нет, я, несмотря на то, что всегда являлся поклонником Гарри Кимовича Каспарова (исключительно в шахматном плане), не собираюсь его оправдывать за то поражение и пытаться доказать, что все было совсем не так, как сейчас общеизвестно. И уж тем более целью не является опровержение некоторых комментариев на шахматную тему к посту хабраюзера alizar. Единственная цель — рассказать некоторые подробности того, что именно произошло в Нью-Йорке в начале мая 1997 года, и почему результат этого противостояния, по мнению автора, на самом деле никому ничего не доказал.

Сразу оговорюсь: автор не является высококвалифицированным шахматистом. Возможно, некоторые, чисто шахматные моменты в данном материале, могут быть раскритикованы людьми, занимающимися шахматами профессионально. Также, увы, автор не силен ни в теории игр, ни в шахматном программировании, и попытается лишь высказать мнение частично шахматиста, частично знакомого с компьютерами, а не создать Всемирную и всемерную энциклопедию Шахматного Программирования.

Недостаточно быть хорошим игроком; вы также должны хорошо играть
(З.Тарраш)

История шахматного программирования началась, по сути, сразу же с обычным программированием. Искусственный интеллект, возможность его создания, волновали людей издавна, и программируемая вычислительная техника оказалась более подходящим средством для поиска такой возможности, чем человек, который обыгрывал Наполеона, сидя в тумбочке. Первые шахматные программы были, впрочем, соперниками лишь друг другу: в силу огромного количества вариантов шахматных партий, речи о полном переборе не было, и нет, кстати, и по сей день. (И не предвидится (с) Швондер.) Это не мешало шахматным программам периодически удивлять профессиональных шахматистов как неожиданно лучшими ходами (что объясняется в первую очередь тем, что форсированные варианты компьютер считает все же быстрее и точнее), так и внезапными просмотрами мата в пару-тройку ходов ради спасения ферзя. Однако, если в тактике даже сравнительно слабые компьютеры были вполне себе сильны, то вот в позиционной игре все было очень печально — если еще как-то можно было научить программу, что ферзь дороже пешки (что в некоторых случаях приводило к вышеупомянутым просмотрам мата), то научить оценке позиции, на которой, собственно, вся партия и держится, возможным не представлялось. Это и неудивительно — правильная оценка позиции — это задача непростая даже для шахматистов-разрядников, единого рецепта нет, даже две практически одинаковые позиции, отличающиеся лишь положением одной пешки, могут иметь противоположные оценки.

С течением времени, впрочем, прогресс стал брать свое. Дебютные библиотеки позволили программам не “плавать” в начальной стадии партии — такие “плавания” нередко приводили к окончанию партии еще в дебюте — все же, несколько столетий опыта и рост дебютной теории с начала ХХ века давали человеку немалую фору. Дебютные библиотеки эту фору не просто устранили — в отличие от человека, компьютер теперь мог разыграть абсолютно любой дебют, уйти от любой дебютной ловушки, да и сам, соответственно, мог в любую ловушку поймать! Шахматистов, знающих все дебюты, не бывает — есть понятие “дебютный репертуар” — это некоторое количество начал, использующихся шахматистом. Человек может этот репертуар расширять, пополнять, готовить, например, новые дебюты к новому турниру, но с появлением у компьютеров в памяти дебютной энциклопедии человек стал проигрывать в этом компоненте. Кстати, фора тут вышла двойная: в отличие от компьютера, который по сути, играет по дебютной библиотеке, человек в ходе партии подсмотреть в дебютную энциклопедию не может. Единственный вариант уравнять тут шансы — неправильные начала, не внесенные в энциклопедии, причем, максимум шансы получится именно уравнять — человек ведь также не имеет возможности применить багаж своих дебютных знаний.

Надо сказать, что проблема дебютных знаний и их чрезмерной распространенности и доступности волновала и самих шахматистов. Так, совершенно нормальными в профессиональных шахматах стали ситуации, когда игроки сделали по 30-40 ходов, и ничего нового в них не было — все эти ходы уже были в другой партии. (Тут, конечно, дело касается не только дебюта, но, как правило, такие ситуации были связаны в первую очередь с дебютными спорами, и некий вариант мог отстаиваться и в глубоком миттельшпиле, и даже в эндшпиле!) Либо ситуации из партий гросс- и супергросс- мейстеров — партия до 20 ходов, обычно — 16-18, все “из книжки” и соглашение на ничью — потому что позиция теоретически ничейна. Спасением виделись Шахматы Фишера, они же Шахматы-960, где фигуры в начальной позиции могут располагаться произвольным образом. Увы (или к счастью?), обычные шахматы этот вариант вытеснить не смог. Почему — сказать сложно, но рискну предположить, что профессиональным шахматистам он не был вполне интересен, им и в стоковых дебютах хватало, чем заняться, а остальным — не давал никаких преимуществ — см. комментарий Каспарова. В самом деле, дебютные принципы не поменялись — “развивай фигуры как можно быстрее и безопаснее и мешай делать то же самое сопернику”, и тот, кто эти принципы понимал в стандартных шахматах — не перестал их понимать и в фишеровских, а кто двигал фигуры исключительно по памяти из справочника и при любом отклонении впадал в панику — стал в эту самую панику впадать гораздо быстрее, на 2-3 ходу.

Гораздо лучше в теории дела обстояли с эндшпилем. Особенно с малофигурными окончаниями — чем меньше фигур — тем лучше. Такие ситуации, в отличие от дебютов, просчитывались куда как проще: фигур-то гораздо меньше! Да и ограничения по количеству ходов способствовали (см. Правило 50 ходов). Так или иначе, компьютеры получили возможность пользоваться Эндшпильными таблицами Налимова и это, пожалуй было еще большей победой, нежели дебютные библиотеки. Впрочем, человек тут имел свои козыри — например то, что множество вариантов шахматных окончаний можно было играть, практически не считая варианты, а пользуясь известными алгоритмами, самый знаменитый пример (первый этюд, вероятность возникновения подобных мотивов в реальной партии достаточно высока).

А вот в миттельшпиле человек оставался хозяином положения. Да, совершенствовались алгоритмы для оценки позиции, да, компьютеры считали все дальше и глубже, но оставалось одно, то, из-за чего компьютеры так пока что и не стали ни писателями, ни композиторами: план. Если в дебюте компьютер мог двигать фигуры исключительно “по книжке”, а в эндшпиле — придерживаться неких алгоритмов, то с планом были трудности. Да, очевидно, если при оценке позиции машина находила у соперника слабые места — то могла делать ходы, направленные на их использование. Если слабые места были у машины — то она могла предпринимать действия для защиты. Однако, живой шахматист не будет руководствоваться только своим планом — он попытается определить планы соперника. Замечательная задача для ИИ. Вот только выполнимая ли?

В 1996 году представители компании IBM предложили Гарри Каспарову сыграть матч против их шахматной программы «Дип Блю» с призовым фондом в $500 тыс. «Дип Блю» — суперкомпьютер на базе системы RS6000, состоящий из 32 узлов, каждый из которых состоял из 512 процессоров, аппаратно оптимизированных для шахматной программы. Производительность «Дип Блю» соответствовала 11,38 GFLOPS, и компьютер мог оценивать до 200 млн позиций в секунду (Википедия).

Тринадцатый чемпион мира Гарри Каспаров всегда считал свое занятие прежде всего творчеством. То есть, тем, что машине недоступно и не будет доступно никогда. Каспаров говорил:

“Если компьютер сможет превзойти в шахматах лучшего из лучших, это будет означать, что ЭВМ в состоянии сочинять самую лучшую музыку, писать самые лучшие книги. Не могу в это поверить. Если будет создан компьютер с рейтингом 2800, то есть равным моему, я сам сочту своим долгом вызвать его на матч, чтобы защитить человеческую расу.”

По иронии судьбы, именно Каспаров стал первым чемпионом мира, проигравшим компьютеру. Первая же партия матча Deep Blue — Каспаров (Филадельфия, февраль 1996 г.) принесла сенсацию — Чемпион Мира повержен машиной. Увы для поклонников ИИ — уже во второй партии чемпион мира реваншировался, а после еще двух партий, завершившихся вничью, выиграл дважды, доказав таким образом, что чемпион мира — это чемпион мира. Все же, было уже понятно, что компьютерные шахматы — это реальная сила, и что во втором матче, который IBM предложила спустя чуть более года, чемпиону-человеку придется постараться, чтобы защитить человеческую расу.

Второй матч Каспарова с “Темно-синим” начался, наверное, даже с огорчительного для любителей интриги результата — Каспаров выиграл белыми легко, избрав неправильное начало (точнее, этот дебют вполне можно классифицировать, как Дебют Рети). Казалось, все ясно, идея Каспарова проста — лишить соперника первого козыря, дебютной библиотеки, и играть просто в шахматы, что машине не дано. Конечно, отойти от теории при игре черными гораздо сложнее, тон ведь задают белые, и тут Каспаров, вероятно, надеялся на Испанскую партию, ту самую, которую в количестве восемнадцати штук играл сам Остап Бендер — старинный дебют, где отыграть по книжке сам дебют мало, надо уметь играть миттельшпиль. И тут-то и началось.

Тот не шахматист, кто, проиграв партию, не заявляет, что у него было выигрышное положение
(И.Ильф)

Итак, сначала — только игровые факты. Партии игрались с контролем 2 часа на 40 ходов (классический контроль времени). Играя черными, Каспаров попытался оживить позицию с помощью жертв, машина эти жертвы отклонила, и в итоге, чемпион мира, оказавшийся в сложнейшей позиции, сдался. Все просто и ясно. Далее часть описания и цитат заимствована отсюда (там же можно посмотреть всю партию №2), часть — описана автором.

По мнению чемпиона, первый звоночек прозвенел на 35 ходу — суперкомпьютер, до этого тративший не более трех минут на ход, задумался на четверть часа. Еще шесть минут — над следующим ходом. Результат был еще более неожиданным — компьютер отклоняет жертву пешек черными.

По условиям, после каждой партии IBM предоставляла распечатки анализов, которые компьютер производил во время каждой партии. По словам Каспарова, вариант, избранный машиной, ей же был оценен, как неясный, в отличие от принятия жертвы, которое машина оценивала как выгодное для себя. “Очень мило. Мы имеем дело с уникальным событием, Машина отказывается от выигрыша трех пешек, потому что ей якобы “неясно” — Г.Каспаров.

Партия продолжалась, и двигалась к логическому финалу, который в конце концов и наступил — Каспаров сдался. Однако чудеса на этом не закончились. Как выяснилось практически сразу — чемпион мира сдался в ничейной позиции. Казалось бы, обвинять тут некого, кроме самого потерпевшего. Но все не так просто. Каспаров сдался, просто поверив, что машина непогрешима. И ошибся. Своим последним ходом в партии машина допустила грубейшую тактическую ошибку, после чего черные могли закончить партию вничью. Удивление Каспарова после партии вполне понятно: машина, нашедшая сильнейший позиционный ход, который оказался не под силу даже многим белковым шахматистам, то есть, обошедшая людей на их же территории — в позиционной игре, тут же проиграла на своей территории, где она не может ошибаться — допустив элементарный тактический зевок?

Эти вопросы до сих пор остаются вопросами, а матч, тем не менее, продолжался. Три партии завершились вничью. Была ли шестая партия для Каспарова своеобразным финалом? Финалом в матче за честь и ум человеческой расы.

В шахматах выигрывает тот, кто ошибается предпоследним
(С.Тартаковер)

Пожалуй, с точки зрения компьютерных шахмат, в шестой партии не произошло ничего интересного. Вопросы в этой партии в основном к чемпиону мира — каким образом он мог сделать ход 7.… h6? Компьютер тут же пожертвовал коня и позиция черных покатилась под откос. После 19-го хода белых Каспаров сдался. Единственное его достижение в данной партии — это то, что официально она не стала самым быстрым поражением в его карьере — шахматные статистики не учитывают партии человека с компьютером. Хотя формально, как вы поняли, это именно такая партия.

Дальше было менее интересно — якобы, IBM отказалась предоставлять логи анализов этой партии, что, судя по всему, неправда (см. ссылки внизу), а предложение Каспарова сыграть еще один матч было встречено корпорацией оригинально — герой матча (Deep Blue) был демонтирован и сдан в ~~утиль~~музей. Впрочем, это как раз легко объяснить тем, что так или иначе, но чемпион мира был побежден, цель достигнута, а выкладывать еще раз круглую сумму для утешения Каспарова в IBM как-то не очень хотели.

И все же, что доказали эти матчи? Что человек повержен? Если брать оба матча Каспарова с DB — то счет остался в пользу Каспарова — 6,5-5,5. Если даже брать только второй — то во-первых, наверное, статистически результат 2-1 в пользу одной стороны (без учета ничьих) ничего не доказывает. Во-вторых, поражение Каспарова в шестой партии — из-за явного зевка — вряд ли на основании такой грубейшей ошибки (я молчу про сдачу Каспаровым второй партии в ничейной позиции) можно доказывать силу шахматной программы.

После переезда Deep Blue в музей, люди, разумеется, не перестали играть в шахматы с компьютером. Однако, о подобных матчах вообще не слышно, гроссмейстеры теперь предпочитают более экзотические виды использования компьютера. Может, ведущие гроссмейстеры просто боятся поражений от машины? Почему тогда владельцы суперкомпьютеров, авторы мощных шахматных программ, не заявляют, мол, вот мы предложили матч, а чемпион мира отказался? Скорее всего дело действительно в падении интереса к шахматам, интереснее сейчас ставить другие задачи перед ИИ, а поражение от машины в шахматы, пусть даже и чемпиона мира — кому оно интересно, ведь “уже давно машина выиграла у чемпиона мира”.

В прошлом веке матчи между компьютером и человеком были очень популярны. Профессионалы шахмат любили показывать своё превосходство над машинами. Но в XXI веке, вместе с приходом нейронных сетей, всё изменилось.

И снова человек потерпел поражение: Libratus отомстил за Claudico

В 2016-м произошло важное событие не из мира покера, после которого стало понятно, что победа в безлимитной игре – вопрос времени. В 2016-м компьютер AlphaGo победил в го лучшего игрока планеты Ли Седоля.

Особенность той победы в том, что компьютер не перебирал комбинации, а учился «думать». Позднее в усовершенствованные AI системы AlphaGo вообще перестали загружать партии с людьми – искусственный интеллект учился только на партиях с самим собой (последняя версия AlphaGo обыграла ту, против которой сражался Ли Седоль, со счетом 100:0).

Одновременно с этим происходила работа над «решением» покера. Наиболее значительных результатов добились в Университете Карнеги Меллон. Сначала там создали Claudico, который в 2015 году сразился с четырьмя профессионалами в хедз-ап покер и проиграл – три из четырех профессионалов обыграли искусственный интеллект на дистанции в 80 тысяч раздач, на время подтвердив, что компьютеру не дается блеф.

За Claudico отомстил Libratus, разработка того же университета. В 2017 году он сразился также против четырех профессионалов, на этот раз количество раздач было увеличено до 120 тысяч, это заняло 20 дней. Уже в начале стало понятно, что профи соревнуются не с Libratus, а между собой – кто проиграет меньше всех. Компьютер легко обыграл всех четверых, зарабатывая по 14,7 больших блайнда за 100 раздач.

Теперь ученым предстояло самое сложное: допустить компьютер до покера, в котором играет больше двух человек. AI должен был не только научиться держать в голове несколько стратегий разных оппонентов, но и разыгрывать мультипоты – когда до вскрытия могут дойти сразу несколько человек.

Каспаров не верил, что компьютер может его обыграть (сначала так и было)

В 1997-м Каспаров был главным шахматистом планеты. Он еще не ушел в политику, обладал титулом чемпиона мира по версии Профессиональной шахматной ассоциации (ПША) и часто представлял человечество в играх против шахматных программ.

Еще в 1989-м Каспаров легко выиграл две блиц-партии у суперкомпьютера Deep Thought, пообещав, что машина никогда не обыграет человека в шахматы.

«Если компьютер сможет превзойти в шахматах лучшего из лучших, это будет означать, что ЭВМ в состоянии сочинять лучшую музыку, писать лучшие книги. Не могу в это поверить. Если будет создан компьютер с рейтингом 2800, то есть равным моему, я сам сочту долгом вызвать его на матч, чтобы защитить человеческую расу», – уверял Гарри.

В первой игре с Каспаровым Deep Thought находился на шахматном уровне в 2552 пункта – далеко до рейтинга чемпиона мира. На помощь искусственному разуму пришел компьютерный гигант IBM, предложивший сотрудничество команде Deep Thought. Проект начинался как диссертационная работа в университете Карнеги-Меллон, а со временем перерос в подготовку первой машины, способной бороться с чемпионом на равных.

IBM поменяла название шахматной программы с поэтичного Deep Thought (Глубокая Мысль), навеянного романом Дугласа Адамса «Автостопом по галактике», на Deep Blue. Причина была проста – носившая неофициальное название Big Blue компания решила увековечить себя в названии шахматного компьютера.

Разработчики постоянно наращивали скорость машины, параллельно совершенствуя программное обеспечение. Работа компьютера основывалась на переборе всевозможных действий после хода соперника и просчете вариантов ответных ходов до тех пор, пока есть время на принятие решения.

Чтобы выстраивать так называемое древо ходов, машина перебирала миллионы вариантов – для этого требовалась максимально высокая скорость. Deep Thought просчитывал около 700 тысяч позиций в секунду, а усовершенствованная версия Deep Blue 1997-го – уже до 200 млн позиций.

В чем привлекательность шахмат и почему они не умрут?

С годами древняя игра только набирает популярность, она пережила пандемию коронавируса, переместившись в интернет. Интерес к шахматам не ослабевает, потому что людям нравится соревноваться, и они всегда ищут новые интеллектуальные стимулы.

Фото взято из занятий в школе шахмат EduChess.

Всегда интересно играть с человеком, который имеет свои стратегии, приемы и мысли.

А в движке не стоит искать врага, а лучше сделать его верным помощником для совершенствования своего уровня игры. Ведь, программа это — незаменимый аналитический инструмент для самоподготовки.

Гарри Каспаров

Сейчас у человека нет никаких шансов против приличной шахматной программы – обыграть компьютер можно, лишь прыгая по уровням сложности.

Но еще 20 лет назад все было иначе: человек на равных сражался с машиной и даже побеждал – за счет творческого подхода и неординарных ходов.

Переломным оказался 1997 год – лучший шахматист мира Гарри Каспаров уступил компьютеру Deep Blue.

Хотя не обошлось без теории заговора.

«Механический турок»

История машин, играющих в шахматы, намного старше истории компьютеров. Она датируется восемнадцатым веком.

К 1769 году относится появление шахматного автомата «Механический турок». Его создал венгерский барон Вольфганг Кемпелен.

Автомат восторженно встретила публика, он обыгрывал сильнейших шахматистов. Но «Механический турок» был мистификацией. Внутри ящика прятался человек. Так, с французским императором Наполеоном сражался венский мастер Альгайер.

Непобедимого механического игрока поместили в 1836 году в филадельфийский музей, где он и сгорел через пару десятилетий.

В чем гроссмейстеры обвиняют программы?

По мнению экс-чемпиона мира Владимира Крамника, его любимые шахматы стали менее творческой игрой. Бездушные расчеты движков привели к появлению библиотеки дебютов и защит, которые гроссмейстеры сейчас знают наизусть.

Владимир Борисович сетует на то, что на высшем уровне иногда вся партия проводится по памяти. Получается, что гроссмейстер, чтобы выиграть, воспроизводит рекомендации компьютера.

Крамник призвал использовать движки в тандеме с людьми для творческих исследований.

Продвинутые шахматы. Человек играет в команде с компьютером.

«Ход королевы» – неожиданный претендент на сериал года: о гениальной шахматистке, наркотиках и одиночестве

Гарри Каспаров

Владимир Крамник

Магнус Карлсен

Сергей Карякин

Заключительная статья из цикла о противостоянии Каспарова с шахматными машинами.

Матч с X3D стал последним сражением Гарри Кимовича с машиной – больше он никогда не играл с компьютерами публично. Впрочем, и его соперничество с людьми тоже продолжалось недолго. Пару лет он ещё играл в обычных турнирах, но в 2005 году решил завершить свою шахматную карьеру. Отныне шахматы стали для него всего лишь хобби. После ухода Каспарова, в шахматах не осталось явного лидера.

На протяжении нескольких лет шахматную корону оспаривало сразу несколько примерно равных по силе гроссмейстеров. Но в 2013 году на вершину поднялся молодой норвежец Магнус Карлсен. Сегодня он чемпион мира и безусловный лидер мировых шахмат. Между тем матчи людей и машин продолжались. В 2004-05 годах в Испании состоялись два матча ведущих гроссмейстеров против лучших шахматных программ. Оба закончились победой команды машин, со счетом 3½:8½ и 4:8.

В ходе второго матча состоялась также последняя на текущий момент, победа человека над одной из топ-программ при классических условиях игры. Честь столь специфического достижения выпала на долю гроссмейстера Руслана Пономарева, который смог воспользоваться оплошностью программы Дип Фриц 9.

Летом 2005 года в Лондоне состоялся матч между гроссмейстером первой мировой десятки Майклом Адамсом и шахматной машиной Гидра (на фото слева). Традиционно, игралось шесть партий. Матч закончился со счетом 0½:5½ в пользу машины. Всё что смог добиться человек в матче - это одна ничья.

И наконец, заключительным аккордом противостояния людей и машин стал матч чемпиона мира Владимира Крамника и шахматной программы Дип Фриц 10 в конце 2006 года. Снова победа машины – 4:2.

Несмотря на какие-то надежды переломить ситуацию, постепенно становилось понятно, что дни противоборства человека с машиной сочтены. По мере совершенствования алгоритмов и железа преимущество компьютеров проявлялось все более и более заметно.

После поражения Крамника, матчи людей с машинами — по крайней мере в классическом формате — прекратились. Общественный интерес к ним практически иссяк. С тех пор если и удавалось организовать подобные матчи, то только в «бюджетном» варианте. Размеры призового фонда упали с нескольких сотен до пары тысяч долларов.

Матчи теперь проводились с укороченным контролем времени, часто против не самых сильных шахматистов. Нередко человеку давалась фора, или же выделялся в помощь более слабый компьютер. С этого момента шахматные программы перестали быть соперником для людей, и постепенно перешли в разряд аналитических инструментов.

На фото – Владимир Крамник играет с программой Дип Фриц 10.

Как и у людей, состав сильнейших программ тоже постепенно менялся. В конце 2005 года на смену «заслуженным» чемпионам старой волны – Джуниору, Фрицу, Шреддеру и другим, пришел новый фаворит – программа Рыбка.

Она намного обогнала конкурентов во всех рейтинг-листах и на протяжении пяти лет никто не смог оспорить её превосходство. С каждой новой версией она все больше и больше прибавляла в силе.

В конце 2010 года на вторые роли Рыбку отодвинул Гудини, став новым, очевидным лидером среди программ. Продержавшись на самом верху мировой табели о рангах около трех лет, он в свою очередь уступил место ещё более сильным конкурентам.

С 2014 года лучшими в мире считаются сразу две программы – Комодо и Стокфиш. В настоящее время они входят в аналитический арсенал практически всех ведущих гроссмейстеров. Стоит еще отметить, что в отличие от коммерческого Комодо, Стокфиш – это программа с открытым исходным кодом. А значит просмотреть её код, или даже просто наблюдать за процессом её совершенствования, может каждый.

Между тем, уровень современных программ продолжает быстро расти и предела их совершенству пока не видно. Но вернемся к вопросу противостояния людей и машин. Могут ли сильнейшие гроссмейстеры обыгрывать лучшие шахматные программы сегодня? Как уже упоминалось выше, нормальные матчи между людьми и компьютерами давно не проводятся, так что судить об этом можно только по косвенным признакам. В первую очередь, это конечно рейтинг. Современные программы уже более чем на 500 пунктов сильнее тех, что играли когда-то с Каспаровым и другими гроссмейстерами. Причем, даже без учета прогресса по части вычислительной техники.

Следует правда иметь в виду, что по результатам многолетних тестов, прирост рейтинга у машин слегка опережает человеческий – где-то в соотношении 5:4 или 4:3. Тем не менее, запас прочности современных программ настолько велик, что лучшие из них сейчас как правило без всякого труда выигрывают у тех программ, оборону которых в свое время безуспешно пытались взломать такие шахматные гиганты как Гарри Каспаров и Владимир Крамник.

Играя против когда-то «заслуженных» Фрицев и Джуниоров, современные программы легко приумножают даже совсем незначительный перевес, и без проблем доводят его до победы. В общем, посредством старых программ и рейтингов можно сделать вполне определенный вывод относительно силы игры современных машин.

Но, помимо рейтингов и матчей программ, несомненно важным является мнение и самих гроссмейстеров. По крайней мере тех, из них, кто в настоящее время постоянно играет в турнирах или занимается тренерской или аналитической работой. Без шахматных программ сегодня не обходится ни один серьезный анализ на «высшем уровне» и ведущие шахматисты (не как программисты конечно, но как пользователи), могут поведать о поведении программ очень многое:

Владимир Тукмаков, международный гроссмейстер:

…В общении шахматиста с машиной был заведомый лидер – человек, который задавал направление поиска, а программа, послушно следуя указаниям лидера, только вносила коррективы и уточнения. Но в последние годы это соотношение драматическим образом и необратимо изменилось. Теперь уже ЖД взял на себя роль жреца и поводыря, оставляя белковому существу возможность практически использовать рекомендации высшего разума.

Сергей Шипов, международный гроссмейстер:

Программы в конце первого десятилетия нового века стали уже намного сильнее людей — лучших из лучших — и это не подвергается сомнениям среди профессионалов. Каждый из нас использует лучшие программы в домашнем анализе, мы их знаем, как родных. Даже лучше… Современные программы (в первую очередь Рыбка и Гудини) обладают удивительно сбалансированной и человечной оценочной функцией. Они уже не такие жадные, как программы 90-х. Тонко чувствуют инициативу, грамотно работают с пешечной структурой, учитывают все важные стратегические факторы… В общем, десятилетия упорной работы программистов и профессиональных шахматистов прошли не зря. Они совместно создали почти идеальных игроков, намного превосходящих нас, живых людей. Это факт.

Сергей Карякин, международный гроссмейстер:

…Я иногда сражаюсь с программой «Гудини» и могу сравнивать. В поединке против компьютера тебя не покидает чувство обреченности…

Возможен ли матч человек — машина сегодня? Каким он может быть? Давайте попробуем оценить варианты подобного соревнования. Во-первых, следует отметить, что разного рода легкие партии проводятся и в наши дни. А вот для серьезного матча нужен солидный призовой фонд, который вряд ли возможен при современном общественном интересе.

Но даже если оставить в стороне финансовые вопросы, то в вероятном матче человеку придется давать какую-то фору – по времени или по материалу. Иначе он вряд ли согласится играть. Фора по материалу (речь конечно идет о топ-гроссмейстерах) скорее всего выльется в одну-две пешки, или их разменный эквивалент из других фигур.

К сожалению, на размер материальной форы, по-видимому не слишком влияет сила игры лучших современных программ. Что естественно делает бессмысленным сравнение этих программ с людьми. Можно, в свою очередь, давать фору не по материалу, а скажем за счет уменьшения времени машины.

Но чтобы современная программа сбавила в силе до уровня компьютеров первой половины 2000-х, потребуется выставить ей около 1 секунды на ход на хорошем современном смартфоне. Подобного рода «подгонка» силы соперников в общем-то лишает смысла само соревнование между человеком и машиной. В лучшем случае мы определим, сколько форы по времени необходимо, чтобы соперники и в самом деле уравнялись в силах. И только.

Какие же есть еще варианты? Отсутствие у компьютера дебютной книги человеку поможет мало, так как машины и без нее играют сильно. От удаления эндшпильных таблиц выигрыш будет ещё меньше.

Повторение ходов из предыдущих партий в основном исключено, вследствие заметной «рандомности» сопутствующей шахматным программам на многоядерных системах. Если же давать в помощь человеку слабую программу, то сразу встает вопрос, насколько велика роль машины в результатах человека.

В общем, трудно представить себе какие-то очевидные и интересные формы игры с компьютерами сегодня. Подводя итоги, можно сказать что время громких матчей людей и машин окончательно ушло в прошлое. Компьютер сегодня не соперник, а помощник людей. Под влиянием машин, да и не только их, современные шахматы постепенно меняются. К чему это приведет, предстоит увидеть нам с вами.

Покер – одна из самых сложных игр для искусственного интеллекта. В отличие от шахмат или шашек, это игра с неполной информацией – компьютер не может точно знать, какие карты на руках у оппонента, он может только догадываться. Кроме того, в покере часто блефуют, что сложно поддается математическому анализу. Наконец, в покер играет, как правило, несколько человек с разными стратегиями – чтобы выигрывать, надо быть успешным против каждой.

Искусственный интеллект уже год как справился с этой задачей. Впрочем, сомнений в том, что это произойдет, не было по крайней мере с 2015 года, когда AI только начал свой путь к покорению покера. Это не повод для грусти – да, покер стал «решенной» игрой, но зато, как и в шахматах, изучение компьютерных стратегий обогатит игру и, возможно, приведет к пересмотру даже тех вещей, которые считаются аксиоматическими.

Расскажем обо всем по порядку, но сначала напомним, что играть в покер с живыми людьми лучше всего в покер-руме GGпокерок. Сейчас там идет мини-WSOP – серия турниров Good Game Series Of Poker для микролимитчиков, полностью повторяющая WSOP, только с небольшими бай-инами и высокими призовыми.

Реванш: машина победила, но Гарри считал, что ей помогали гроссмейстеры

Второй матч Каспарова и Deep Blue назначили на май 1997-го.

Разработчики оперативно правили ошибки, делая мысли машины более гибкими, а к работе привлекли нового топ-гроссмейстера Мигеля Ильескаса. Ожидалось, что Каспаров выберет антикомпьютерную тактику – нестандартные решения и неожиданные ходы.

Матч проходил на 35-м этаже нью-йоркского небоскреба Equitable Building. В этот раз Каспарова и Deep Blue разделяли не километры, а несколько стен – компьютер из двух блоков находился в отдельном помещении. Призовой фонд вырос до 1,1 млн – 400 тысяч получал уже проигравший, а не победитель, как год назад.

IBM поработала и над пиар-составляющей матча: пригласила журналистов, организовала трансляцию и отдельный зрительный зал.

Регламент сохранился – 6 партий за 6 дней. Каспаров начал белыми и выиграл – компьютер оказался не готов к нестандартному подходу человека. В конце партии машина грубо ошиблась: вместо того, чтобы продлить партию еще на десяток ходов, пришла к безнадежной позиции намного быстрее.

Но уже во второй партии Каспаров, уверенный, что компьютер просчитывает дальновидные схемы, в какой-то момент остановил партию и поздравил машину с победой. Оказалось, что Гарри переоценил возможности машины: атакующий маневр, с которым он смирился, машина просто не видела, а значит, партия легко сводилась к ничьей. В этом момент чемпион мира заподозрил владельцев в махинациях, обвинив IBM в том, что компьютеру помогает живой человек, а связка машина-гроссмейстер превосходит даже лучшего шахматиста мира в несколько раз.

«Я думал, раз машина, которая так сильно провела всю партию, уверенно делает ход, значит, она видит, что вечный шах черные объявить не могут. И не стал проверять. А ничья там была! Вот у меня и возникло подозрение: больно уж некомпьютерная ошибка. Элементарный человеческий зевок», – сетовал Каспаров в интервью «Коммерсанту» после матча.

Дальнейший прогресс компьютеров

Первую программу для игры на обычной шахматной доске со всеми фигурами создал ученый Алекс Бернштейн в 1957 году.

Через год команда американских ученых во главе с Алленом Ньюэллом, Клиффом Шоу и Гербертом Саймоном разработала так называемый алгоритм уменьшения дерева поиска. Функции всех современных шахматных программ построены на его основе.

Игра на доске 6×6

Через год в ядерной лаборатории Лос-Аламосана компьютере MANIAC была разработана шахматная программа для игры без слонов на доске 6×6. Первая партия продолжалась около 10 часов и завершилась победой сильного шахматиста.

А вот девушку, которая была новичком в игре, машина одолела на 23-м ходу. Тогда, это считалось большим достижением для машины.

Компьютер побеждает чемпиона мира

В 1996 году разработчики компьютера DeepBlue праздновали успех. Впервые в истории при стандартном часовом контроле шахматная программа победила чемпиона мира. Правда, Гарри Каспаров матч в итоге выиграл.

Но уже через год усовершенствованная версия программы DeepBlue одолела чемпиона. Общий счет: 3,5-2,5.

В новом, 21-м веке, компьютеры стали недосягаемы для человека, и матчи между ними прекратились. Шахматные программы превратились в незаменимого помощника, как маститого гроссмейстера, так и обычного любителя.

Машина достигает уровня мастера

В 1983 году пионер компьютерной науки Кен Томсон при поддержке Джо Кондона создал машину Belle. Она была предназначена исключительно для игры в шахматы. Официальный рейтинг Эло машины был 2250, таким образом она достигла мастерского уровня.

Шахматные компьютеры появляются в теории.

Реальную историю компьютерных шахмат принято вести с 1951 года. Тогда произошло два события.

Английским математиком Аланом Тьюрингом был написан алгоритм, при помощи которого машина смогла бы играть в шахматы, но только в ее роли выступал сам изобретатель.

Программа из-за отсутствия доступа к компьютерам в работе ни разу не проверялась. Зато в истории сохранено название — «бумажная машина Тьюринга». Чтобы сделать ход, требовалось минимум полчаса.

Тогда же американский математик Клод Шеннон опубликовал первую статью о шахматном программировании. Ученый отмечал теоретическое существование в шахматах лучшего хода, а также практическую невозможность его нахождения.

На сцену выходят нейронные сети

Сейчас сильнейшим шахматным движком считаются нейронные сети. Так LeelaChessZero (LC0) уверенно победила Stockfish. Еще можно вспомнить знаменитую AlphaZero.

Нейронные сети способны в целом оценивать обстановку на доске, они предпочитают позиционный стиль, захват пространства и контроль над доской. LC0 сначала знала только основные правила движения фигур. Нейросеть, самообучаясь, провела с самой собой миллионы партий и стала лучшей в мире и скорее всего сохранит лидерство в обозримом будущем.

В целом, нейро-алгоритмы способны решать важнейшие исследовательские задачи, включая разработку новых материалов и лекарств.

Каспаров возвращается спустя 12 лет. И это большой сюрприз

Над машиной работали не только программисты, но и шахматисты. Спаррингом компьютера и разработчиком дебютной книги был американский гроссмейстер Джоэл Бенджамин, позже к нему присоединились другие профессионалы.

Первый матч между Каспаровым и обновленным Deep Blue прошел в 1996-м. Турниру благодаря IBM выделили щедрый призовой фонд: 500 тысяч долларов, из которых победителю доставалось 400. Формально партии проходили в Филадельфии, хотя компьютер находился в Нью-Йорке, а ходы за него делал оператор, получивший сигнал онлайн. На случай проблем со связью IBM привезла две резервные машины с чуть меньшей мощностью.

Первая партия завершилась сенсационной победой Deep Blue – впервые в истории компьютер выиграл у чемпиона мира партию с классическим контролем времени. Но Каспаров быстро отыгрался, без особых проблем сведя матч к победе – 4:2 в пользу человека.

Радостный Каспаров после матча хвалил IBM, но уже не был так категоричен в отношении его перспектив:

«Впервые в истории человечества мы имеем что-то очень близкое к искусственному интеллекту. Уже есть возможность уменьшить число ошибок и достичь уровня игры, который определяется интуицией человека. Сейчас – там где я интуитивно чувствую, играю ли я правильно или ошибочно, – машина просто перебирает миллиарды и миллиарды вариантов. Но не исключено, что в дальнейшем удастся создать алгоритм, который был бы сравним с интуитивным мышлением человека».

Создатели компьютера согласились с Каспаровым и предложили ему реванш через год.

Первый матч шахматных программ

В 1967 году произошло знаковое событие. Созданная в советском Институте теоретической и экспериментальной физики шахматная программа в матче из четырех партий со счетом 3-1 победила программу Стэнфордского университета. Гроссмейстеры полагали, что она играла в силу третье разрядника.

И тут пришел Pluribus

Новую разработку университет Карнеги Меллон делал вместе с Facebook. В 2019 году Pluribus сыграл два матча: в одном он сражался с пятью профессионалами, в другом – профессионалы сражались с пятью копиями AI, которые не передавали информацию друг другу. Иными словами, Pluribus решил победить самый популярный тип покера.

За 12 дней компьютер сыграл 10 тысяч раздач и оказался успешен в обеих дисциплинах – покерные игроки не могли подобрать ключ к искусственному интеллекту ни в одиночку, ни когда все были за столом. Pluribus постоянно менял стратегии, не давая возможности различить паттерны в его действиях. Кроме того, он делал шаги, которые в покере считаются минусовыми и ассоциируются с действиями новичков. В частности, обсуждались его частые «донк-беты»: компьютер играл пассивно, а когда на столе появлялась следующая карта, вдруг ставил в оппонента, который до этого был агрессором (как правило, такие ставки считаются показателем блефа и легко раскусываются даже непрофессиональными игроками).

Из комментариев профессиональных игроков мы знаем, что все AI играют не только непредсказуемо, но и очень агрессивно: чтобы проверять их блефы или полублефы, игрокам надо жертвовать значительным количеством фишек. Кроме того, в его модель было заложено, чтобы Pluribus в основном сосредотачивался на следующих двух-трех шагах, а не на долгосрочной стратегии – и это дало неожиданно хорошие результаты.

«Можно с уверенностью сказать, что он играет на сверхчеловеческом уровне. И это уже не поменяется», – уверен один из разработчиков Pluribus Ноам Браун.

Теоретически еще остались виды покера, в которых искусственному интеллекту предстоит доказать свою состоятельность – например, в больших турнирах, где стратегию необходимо адаптировать к постоянному увеличению обязательных ставок. Тем не менее, уже сейчас можно сказать, что покер стал «решенной» игрой.

Разработчики Pluribus не планируют зарабатывать на покере: их модель перестала обновляться, и можно надеяться, что по крайней мере какое-то время такие AI не выйдут из стен научных лабораторий и не убьют онлайн-покер. Сами ученые считают, что похожие на Pluribus системы пригодятся в кибербезопасности, в финансовых переговорах, для предотвращения преступлений или будут помогать компьютерам в беспилотных автомобилях – в общем, везде, где приходится сталкиваться с решением задач с неполной информацией.

Ну а игрокам в покер остается только изучать раздачи Pluribus и других AI и подмечать в них что-то, что сделает их похожим на суперкомпьютер. А также соревноваться в онлайн и офлайн-турнирах по типу WSOP, Мировой серии покера для живых людей (искусственному интеллекту вход запрещен), которая в этом году проходила в покер-руме GGпокерок. За время серии общий призовой фонд превысил несколько десятков миллионов долларов.

Шахматный компьютер вступает в битву с человеком

Еще 50 лет назад был актуален вопрос: когда машина победит человека? Международный гроссмейстер Дэвид Леви в 1968 году заключил пари, заявив, что ни один компьютер не сможет в течение ближайших десяти лет обыграть его.

Шахматист выиграл спор, но он даже не подозревал, что пройдет немного времени, и машина начнет побеждать чемпионов мира. Сам Леви в 1989 году проиграл программе DeepThought.

У этой машины спустя пару лет выиграл Гарри Каспаров.

Каспаров против компьютера

Первый чемпионат движков

В августе 1974 года случилось еще одно важное событие. В шведском Стокгольме состоялся первый Чемпионат мира по шахматам среди компьютерных программ. Победу одержала советская «Каисса». Она победила во всех четырех партиях.

Всего в турнире приняли участие 13 машин. Ходы передавались по телефону.

Deep Blue больше никогда не играл в шахматы. А по его матчу с Каспаровым даже поставили пьесу

Матч Каспарова против Deep Blue поджег интерес к шахматам – за поединком следил весь мир.

Гроссмейстер, отойдя от болезненного поражения, предложил IBM реванш, а на кон ставил чемпионский титул, но компания ожидаемо отказалась – благодаря победе над чемпионом мира акции IBM устремились вверх. Новый успех уже не повлиял бы на котировки, зато поражение могло испортить ситуацию.

После матча в Нью-Йорке Deep Blue никогда не участвовал в официальных матчах – ни против людей, ни против других машин. Сейчас один из блоков компьютера хранится в Музее компьютерной истории в Калифорнии, второй – в Национальном музее Американской истории в Вашингтоне. Платы остались в исследовательском центре IBM.

Каспаров позже садился за стол против других компьютеров: в январе 2003-го разошелся миром с программой Deep Junior, а в ноябре участвовал в мачте с использованием 3D-технологии против программы Fritz (и снова ничья). Дальше Гарри не играл с машинами на публику, а через пару лет завершил карьеру.

После него шахматисты несколько лет сражались с программами, но с каждым разом все с меньшими шансами на победу. Последней точкой стало поражение чемпиона мира Владимира Крамника в конце 2006-го программе Deep Fritz (2:4).

Интерес к противостоянию людей и машин пропал, когда шансов против компьютера уже не осталось. Сейчас подготовку гроссмейстера не представить без компьютера, но игра на результат с ним бесполезна: рейтинговый рекорд действующего чемпиона мира Магнуса Карлсена составляет 2882 пункта, а сильнейшая шахматная программа набрала 3534. Для сравнения: разрыв между Карлсеном и 100-м номером шахматного рейтинга – всего 213.

В 2003 году вышел документальный фильм Game Over: Kasparov and the Machine. Первое поражение чемпиона мира в матче с компьютером привлекло внимание и поп-культуры: в 2013-м в Нью-Йорке поставили театральную пьесу «Машина» по мотивам поединка. В том же году Disney приобрела права на экранизацию этой пьесы.

Благодаря сериалу Netflix «Ход королевы» шахматы снова в топе обсуждений у массового зрителя.

Карпов или Каспаров? 35 лет главному спору шахмат: играли без флагов, матч обрывали – а Гарри протестовал уже тогда

Дальше последовали три ничьи – к последней партии человек и компьютер подошли с равными шансами: 2,5:2,5. Deep Blue играл белыми, а Каспаров пошел ва-банк – выбрал нетипичный для черных дебют. Поражение случилось уже на 19-м ходу – самое быстрое в его карьере.

После матча Каспаров был в ярости – снова утверждал, что компьютеру помогали гроссмейстеры, иначе странную игру в первых партиях не объяснить. IBM даже получила от чемпиона мира запрос расшифровки отдельных ходов.

«После невероятного напряжения того матча, которое усугублялось подозрительным поведением IBM и моей склонностью к сомнениям, я не был готов легко признать поражение. Честно говоря, я никогда не умел проигрывать. Человек, который легко смиряется с поражением, никогда не станет настоящим чемпионом, и этот принцип, конечно, справедлив и в моем случае. Но я верю в честную борьбу. Тогда же я считал, что IBM обманула меня – а также весь мир, пристально следивший за нашим матчем», – писал Каспаров в книге «Человек и компьютер: Взгляд в будущее».

По одной из версий, именно эмоции помешали Гарри выиграть. После нестандартных ошибок в первых партиях он переоценил машину и начал ее бояться. В книге «Сигнал и шум» журналиста The New York Times Нейта Силвера один из создателей Deep Blue Мюррей Кэмпбел объяснил ошибку в первой партии обычным багом.

То, что Каспаров принял за дальновидность (а потом – за человеческий фактор), оказалось ошибкой в программе. По условиям матча разработчики вносили изменения в код компьютера, поэтому баг исправили после первой же партии. Вот только чемпион мира об этом не знал и напряженно ждал непредсказуемых ходов.

«Каспаров решил, что неожиданная игра была признаком высшего интеллекта. Он никогда не думал, что дело – просто в сбое. Машина не проявляла упорства не потому, что видела новый вариант развития партии, а всего лишь из-за того, что в проигрышной ситуации делала выбор случайным образом – компьютеру все равно, на каком ходу закончится партия, если вариантов для победы нет. А Каспаров не просчитал этот вариант», – объяснял Кэмпбел.

Гроссмейстер еще долго не мог смириться с поражением. Появлялись разные объяснения: недостаток подготовки, начало политической деятельности (в книге «Мой шахматный путь» Каспаров писал, что весной помогал генералу Александру Лебедю). Конечно, досталось и IBM:

«Я столкнулся с могучим противником, обладающим неограниченными ресурсами, который поставил перед собой задачу любой ценой выиграть матч у Каспарова. При этом IBM одновременно является спонсором, арбитром, организатором. IBM дала мне понять, что идет война. При этом весь военный антураж они контролировали от начала до конца. Все, что находилось в этом здании, принадлежало IBM, оплачивалось IBM. И если отвлечься от необъяснимых моментов в игре машины, то человеку в таких условиях очень трудно нормально сосредоточиться. Я так и не смог настроиться на нормальный матч».

Спустя годы Гарри поменял мнение, согласившись, что был частью важнейших перемен. Он принял результат матча, а будущее видел уже не в противостоянии человека и машины, а в их сотрудничестве.

В чем программа сильнее человека и в чем шансы гроссмейстера?

Шахматные компьютеры заметно опережают «белковых» оппонентов в тактических маневрах. Особенно опасным в их «руках» является ферзь. Поэтому гроссмейстеры стараются как можно быстрее разменять самую сильную фигуру.

Еще одной тактикой игры против машины являются долгосрочные маневры. Их программа может и не заметить в рамках глубины поиска. Так, Владимир Крамник победил DeepFritz при помощи долгосрочного продвижения проходной пешки, выгоды этого маневра компьютер обнаружил слишком поздно.

Также, все шахматные движки оснащены дебютными и эндшпильными базами, что делает игру против них невероятно трудной.

Крамник против компьютера

Первая победа: Cepheus

Сконструировать такой искусственный интеллект, который бы устойчиво обыгрывал людей в их любимые игры – одна из самых сложных задач современности, поэтому неудивительно, что ей занимаются в основном ученые. Программу Cepheus, названную то ли в честь персонажа греческой мифологии Кефея, то ли в честь созвездия (а скорее всего – в честь обоих), разработали еще в 2014 году эксперты из университета в Альберте.

Результаты их работы были опубликованы в Science: через 70 дней обучения Cepheus стал настолько хорошо играть в хедз-ап (=один на один) пот-лимит (=с фиксированными ставками) покер, что мог обыгрывать любого профессионала. Более того, он выбирал такие ходы, которые исключали, что человек, даже если будет играть с Cepheus всю жизнь, сможет достичь уровня компьютера. «Мы не говорим, что он будет выигрывать деньги каждую раздачу. Но на дистанции компьютер не может проиграть – будет ничья или победа AI», – радовался один из разработчиков Cepheus Майкл Боулинг.

Тогда казалось, что это еще не конец. В конце концов, покер с лимитированными ставками не настолько популярен, как безлимитный, к тому же понятно, что вариантов применить блеф там намного меньше. Поэтому победа Cepheus не оказала большого влияния на покерный мир, а ученые начали создавать такой компьютер, который бы умел играть в безлимитные игры.

Насколько движок сильнее человека?

В недавнем небольшом матче один из лучших гроссмейстеров мира Хикару Накамура играл с одной из сильнейших программ Komodo. Американец получал различные форы: пешку, пешку и ход, качество и четыре хода, не пересекая фигурами середины доски.

Накамура три партии свел вничью и одну проиграл.

А вот обычный гроссмейстер уверенно обыгрывал машину с форой в две пешки. Поэтому, можно сделать грубую оценку. Преимущество лучших программ над ведущими гроссмейстерами где-то между одной и двумя пешками форы.

Последние 5 лет рейтинг компьютера продолжает расти, в то время как у человека остается на одном уровне.

Читайте также: