Wednesday, December 06, 2017

DeepMind’s AI became a superhuman chess player in a few hours, just for fun (English, Russian)

The descendant of DeepMind’s world champion Go program stretches its muscles in a new domain.

DeepMind AI стала сверхчеловеческим игроком в шахматы за несколько часов, просто для развлячения.

Новая версия программы обыгрвшей в Go чемпиона мира среди людей, разминает свои мышцы в других областях.

Ниже есть продолжение.

...a descendant of the AI program that first conquered the board game Go has taught itself to play a number of other games at a superhuman level. After eight hours of self-play, the program bested the AI that first beat the human world Go champion; and after four hours of training, it beat the current world champion chess-playing program, Stockfish...

...the new AlphaZero is a “more generic version” of the same software, meaning it can be applied to a broader range of tasks without being primed beforehand...
https://www.theverge.com/2017/12/6/16741106/deepmind-ai-chess-alphazero-shogi-go

...Новая версия программы обыгрвшей в Go чемпиона мира среди людей, научил себя играть в ряд других игр на сверхчеловеческом уровне. После восьми часов самостоятельной игры программа превзошла AI, котороя первой победила чемпиона мира по Go среди людей; и после четырех часов обучения он обыграл текущую лучшую в мире шахматную программу, Stockfish...

...новый AlphaZero является «более общей версией» того же программного обеспечения, то есть он может применяться к более широкому кругу задач, без получения предварительной информации...

Для получения правильной перспективы, максимальный ELO чемпиона мира по шахматам среди людей Магнус Кальсен - 2882. У Stockfish ELO - 3300. Цитата из Википедии:

Если рейтинги обоих игроков равны, вероятность победы одного из них равна вероятности победы другого из них (что равносильно среднему количеству 0,5 очков за игру).

Если различие между двумя игроками составляет 200 пунктов, то сильнейший игрок набирает в среднем около 0,76 очка за игру.

Если различие составляет 400 пунктов, то это среднее примерно равно 0,91.

Различие в 600 пунктов означает, что сильнейший игрок выигрывает «почти» всегда (в среднем около 0,97 очка за игру).
https://ru.wikipedia.org/wiki/Рейтинг Эло

То есть у чемпиона мира по шахматам среди людей нет никаких практически шансов, даже если он играет белым, чтобы конкурировать со Stockfish. А Stocksfish был легко побеждён AlphaZero.

Когда AlphaZero играл белым, результат был 25 побед и 25 ничьих, 0 проигравших.

Когда AlphaZero играли черным, результат был 3 победы, 47 ничьих, 0 проигравших.

Только когда AlphaZero играл черным, у Stockfish был шанс ... сделать ничью.

P.S. Ссылка на оригинальную статъю https://arxiv.org/abs/1712.01815


No comments:

Post a Comment