Го — китайська настільна гра з 19×19 дошкою і простими правилами, але астрономічною комбінаторикою: 10^170 можливих позицій (для порівняння — у Всесвіті ~10^80 атомів). Шахові боти типу Deep Blue (1997) перемагали через brute-force обчислення мільйонів варіантів — у го такий підхід принципово не працює, бо варіантів забагато.
DeepMind, лондонський стартап під крилом Google, поєднав два підходи: глибокі нейромережі, навчені на 30 млн позицій з ігор професіоналів, оцінювали якість ходів і шансів на перемогу; пошук Монте-Карло грав мільйони можливих продовжень за одиниці секунд, направляючись підказками від мережі. Систему назвали AlphaGo.
У жовтні 2015-го AlphaGo вже виграв 5–0 у європейського чемпіона Фань Хуея. Але справжній тест чекав 9–15 березня 2016-го у Сеулі: матч проти Лі Седоля — 18-кратного чемпіона світу і одного з найсильніших гравців історії го. AlphaGo виграв 4–1, тривалий третій хід 37 у другій партії стане відомим у спільноті як «Move 37» — ідея, яку жодна людина не зробила б, але яка статистично виявилась оптимальною.
Це був Sputnik moment ШІ: загалом доменно-незалежний підхід DeepMind за рік народив AlphaZero, який без жодного людського досвіду навчився шахів, го і сьоґі за 4–24 години і обігнав усі попередні системи. Той же напрям привів пізніше до AlphaFold (передбачення структури білків, Нобель з хімії 2024) і до сучасної хвилі ШІ загалом.
«Я думав, AlphaGo рахує. Але вона грала так, ніби розуміла», — Лі Седоль після матчу.