AlphaGo переграв чемпіона з го Лі Седоля

У березні 2016 року програма AlphaGo від DeepMind виграла 4–1 у легендарного гравця в го Лі Седоля. Го вважалось грою, де комп'ютер не зможе перемогти людину ще десятиліттями — кількість позицій більша за число атомів у Всесвіті.

Регіон: Світ
Вплив: Високий

Було: Шахи комп'ютери виграли в 1997-му (Deep Blue проти Каспарова). Го з його 10^170 позиціями здавалось поза межами brute-force-методів і потребувало «справжньої інтуїції».
Стало: Глибоке навчання плюс пошук Монте-Карло вирішують непереборні задачі. Через рік AlphaZero перевершив усіх шахових ботів за 4 години самонавчання.

Го — китайська настільна гра з 19×19 дошкою і простими правилами, але астрономічною комбінаторикою: 10^170 можливих позицій (для порівняння — у Всесвіті ~10^80 атомів). Шахові боти типу Deep Blue (1997) перемагали через brute-force обчислення мільйонів варіантів — у го такий підхід принципово не працює, бо варіантів забагато.

DeepMind, лондонський стартап під крилом Google, поєднав два підходи: глибокі нейромережі, навчені на 30 млн позицій з ігор професіоналів, оцінювали якість ходів і шансів на перемогу; пошук Монте-Карло грав мільйони можливих продовжень за одиниці секунд, направляючись підказками від мережі. Систему назвали AlphaGo.

У жовтні 2015-го AlphaGo вже виграв 5–0 у європейського чемпіона Фань Хуея. Але справжній тест чекав 9–15 березня 2016-го у Сеулі: матч проти Лі Седоля — 18-кратного чемпіона світу і одного з найсильніших гравців історії го. AlphaGo виграв 4–1, тривалий третій хід 37 у другій партії стане відомим у спільноті як «Move 37» — ідея, яку жодна людина не зробила б, але яка статистично виявилась оптимальною.

Це був Sputnik moment ШІ: загалом доменно-незалежний підхід DeepMind за рік народив AlphaZero, який без жодного людського досвіду навчився шахів, го і сьоґі за 4–24 години і обігнав усі попередні системи. Той же напрям привів пізніше до AlphaFold (передбачення структури білків, Нобель з хімії 2024) і до сучасної хвилі ШІ загалом.

«Я думав, AlphaGo рахує. Але вона грала так, ніби розуміла», — Лі Седоль після матчу.

#AI #machine-learning #DeepMind #neural-networks

Джерела

Надішли постійне посилання на цей факт.

До 2016

AlphaGo переграв чемпіона з го Лі Седоля

Джерела

Поділись фактом