Программа за 3 дня сама себя научила играть в шахматы лучше гроссмейстеров

TKSAG TKSAG

Алгоритм Giraffe, написанный студентами, не использовал базы партий и настроенные программистами инструменты для анализа: он просто играл с самим собой в течение 72 часов.

Программу Giraffe, которая сама научилась играть в шахматы и всего за 72 часа достигла уровня международного гроссмейстера, написал студент Имперского колледжа в Лондоне, сообщает сайт N+1. Программа стала основой для магистерского диплома, почитать который можно вот здесь.

У Giraffe есть два отличия от других шахматных программ. Во-первых, она не использует заранее заложенных рекомендаций по базе готовых позиций, а «знала» только правила игры и училась, разыгрывая партии сама с собой. Во-вторых, она даже не пыталась анализировать все возможные варианты решений для каждого хода, к чему стремятся создатели других алгоритмов и для чего требуются компьютеры огромной вычислительной мощности. Обычная программа проверяет все варианты на максимально доступную глубину для данной мощности (например, на 5 ходов вперед или на 10 ходов вперед). Giraffe на каждом этапе проверяла только часть вариантов: те, которые вели к наиболее длинной цепочке ходов. Но эти варианты анализировала тщательно.

Giraffe – далеко не самая сильная шахматная программа. Среди девяти различных программ для персональных компьютеров и небольших серверов она заняла второе место. Уникальным является метод самообучения и скорость, с которой оно довело сравнительно несложного робота до мастерства, сопоставимого с уровнем шахматистов из верхних 2% рейтинга ФИДЕ.

Теперь создатель Giraffe попытается испытать его в других настольных играх, поскольку его алгоритм самообучения универсален.

Впервые компьютер обыграл чемпиона мира Гарри Каспарова в 1997 году со счетом 3,5 на 2,5. Сегодня лучшие компьютеры без проблем обыгрывают в шахматы любого человека. В 2014 году гроссмейстера обыграла программа для персонального компьютера Stockfish 5 (первое место в рейтинге, где у Giraffe – второе) со счетом 1-3, причем две партии человек играл с форой в пешку, а две – используя подсказки другой шахматной программы.