«Го играть, я создал»: Как компьютеры побеждают людей

Го — это игра для двух игроков, один играет белыми камнями, другой — черными. Цель — отгородить камнями своего цвета большую территорию, чем у противника. Когда программа AlphaGo выиграла у трехкратного чемпиона Европы по го Фань Хуэя со счетом матча 5:0, побежденный чемпион назвал искусственный интеллект «очень сильным и непоколебимым, как стена». Также Хуэй добавил: «Если бы я не знал, что AlphaGo — это компьютер, то не усомнился бы в том, что это человек. Немного странный, очень техничный, но совсем как настоящий». Результаты игры были объявлены лишь три месяца спустя — 27 января 2016 года, одновременно с публикацией статьи в журнале Nature. Подробности о судьбоносном матче можно узнать из этого видео.

Ранее разработчики AlphaGo, команда DeepMind (британская компания — разработчик искусственного интеллекта, основанная в 2010 году в Лондоне и приобретенная Google в 2014 году), уже тестировали своего «зверя» на других программах — симуляторах игры го. Тогда AlphaGo разгромила всех своих коммерческих и freeware-противников (программы Crazy Stone, Zen, Pachi, Fuego) с чудовищным результатом: программа AlphaGo победила в 494 из 495 игр. При этом до недавних пор го была одной из самых сложных игр для компьютерных систем — среди главных причин называлось возможное количество ходов, неизмеримо большее, чем при игре в шахматы. Математик Джон Тромп подсчитал точное число комбинаций игры — их оказалось больше, чем атомов в наблюдаемой Вселенной.

Интересно еще и то, что свобода самообучения позволяет искусственному интеллекту Google DeepMind осваивать другие игры — ведь AlphaGo является лишь одной из программ проекта DeepMind. К примеру, в феврале 2015 года система научилась играть в видеоигры с видеоприставки Atari 2600 — тогда журнал Nature рассказал о том, что на данный момент программа справляется с 49 играми: Ms. Pac-Man, Roadrunner, Kung-Fu Master и другими. Самое удивительное заключалось в том, что программа Демиса Хассабиса (одного из трех основателей компании) не взламывает код и алгоритмы игры, а в прямом смысле учится играть, улучшая свои навыки от матча к матчу, как любой обычный геймер. Уже сейчас искусственный интеллект DeepMind справляется с 3D-игрой Labyrinth (мирный аналог Doom), а в ближайшей перспективе научится играть в стратегии Warcraft и StarCraft.

Невозможная ранее победа компьютера в го стала возможна благодаря технологиям самообучения AlphaGo, а также сразу двум искусственным нейронным сетям — особым алгоритмам, которые имитируют работу цепочек нейронов в мозге человека. Алгоритмы обучения были отработаны в том числе и на упомянутых консольных играх: через информацию о пикселях на экране и счет программа постигала логику игры, совершая случайные действия и наблюдая за результатами этих действий. Уже через несколько часов программа с легкостью побеждала почти в каждой игре. Компания Google купила DeepMind за $650 млн именно после выхода статьи в Nature, опередив Марка Цукерберга. На сегодняшний день выросшая из DeepMind AlphaGo, которая закалилась благодаря матчам с профессионалами, достигла рейтинга в 3,1 тысячи эло, что соответствует уровню гроссмейстера международного уровня в шахматах или профессиональному 3-му дану.

Илья Шикшин

трехкратный чемпион Европы по го, шестикратный чемпион России по го, заслуженный мастер спорта России

«Уже в течение нескольких десятков лет делаются попытки научить искусственный интеллект играть в го на высоком уровне. С 1990-х годов до 2015 года уровень программ возрос с уровня начинающих до уровня сильных любителей. Победа же программы AlphaGo примечательна тем, что это первая победа искусственного интеллекта над профессиональным спортсменом. Говорить о том, что это значит для мира го, пока рано. Можно лишь сказать, что это стало неожиданностью. Сложно сказать о том, какой отпечаток наложит поражение на спортивную репутацию Фань Хуэя, и пока непонятно, что думать об этой программе. Надеюсь, что в скором времени она появится в общем доступе и ее можно будет потестить. Фань Хуэя я видел в эти выходные на соревнованиях в Санкт-Петербурге. Он выглядел отлично».

Есть ли у людей шанс отыграться?

После первой победы можно сказать точно — команда DeepMind явно не остановится на достигнутом. О новой серии из пяти игр, которые будут проходить 9–15 марта в Сеуле, заявил в своем твиттере глава проекта Демис Хассабис, прямую трансляцию баталий можно будет наблюдать в реальном времени в ютьюбе. На этот раз противником AlphaGo станет чемпион мира по го — 32-летний кореец Ли Седоль. Чемпион так комментирует вызов: «Впервые компьютер смог составить конкуренцию профессионалу-человеку в полностью честной игре, и я польщен, что стану следующим противником AlphaGo. Вне зависимости от того, проиграю ли я или выиграю, этот результат станет важной вехой в истории го. Я слышал, что эта система ИИ очень сильна в игре и становится только умнее, но я уверен, что я смогу выиграть у нее хотя бы в первый раз», — заявил Ли Седоль, чемпион мира по го из Южной Кореи. Спортсмен уверен в своем выигрыше со счетом 4:1 или 5:0, но при этом уверяет, что через 2–3 года создатели AlphaGo захотят взять у него реванш, и тогда с учетом отладки и самообучения системы победить будет трудней.

Ли Седоля считают агрессивным игроком, его авторитет в профессиональной среде крайне велик — он обладает девятым даном по го (Фань Хуэй обладал «всего лишь» вторым), занимает третье место по количеству выигранных титулов в Корее и второе — по количеству международных титулов. При этом в числе слабостей Седоля называют его эмоциональность, склонность к пессимизму в трудных игровых ситуациях. Все это может негативно повлиять на исход игры с AlphaGo. К тому же Седоль признается, что иногда испытывает недостаток концентрации: «Если играю в пятницу, то могу задуматься о пробке по дороге домой. Конечно, я концентрируюсь на важном, но ведь я — человек». Для Google DeepMind (как и для всех разработчиков ИИ) победа над Седолем будет означать серьезный скачок развития для систем искусственного интеллекта с глубинным обучением — одного из самых важных, востребованных и перспективных IT-направлений сегодня. Сможет ли Google DeepMind упрочить свои позиции в го?

Зачем эти игры нужны Google?

Сегодня работы над созданием искусственного интеллекта ведутся в разных уголках мира. Разные системы уже могут писать сценарии компьютерных игр (Scheherazade, Технологический институт Джорджии), превосходить человека в анализе данных и интуиции (Data Science Machine, Массачусетский технологический институт), безопасно водить автомобиль (Google DeepMind), распознавать эмоциональность романов (Эссекский университет), заниматься факт-чекингом (Wikipedia Knowledge Graph), читать тексты и отвечать на вопросы о содержании прочитанного (снова Google DeepMind), пройти IQ-тест на уровне четырехлетнего ребенка, имитируя мышление человека (ConceptNet, Массачусетский технологический институт), отвечать на письма вместо пользователей (Google Smart Reply), распознавать лица (DeepFace, Facebook) и жесты (Nest, Google).

Симптоматично и то, что Марк Цукерберг, в 2013 году упустивший стартап DeepMind, недавно объявил своей главной целью 2016 года создание искусственного интеллекта в недрах Facebook, в общих чертах описав его функционал — помощь с делами по дому и в работе.«Примерно как Джарвис в «Железном человеке», — добавил Цукерберг в своем посте. На данный момент среди заслуг команды Цукерберга на ниве ИИ-систем числится распознавание капчи (благодаря инвестиции $40 млн в компанию Vicarious), умный чатбот Facebook, «интеллектуальная» камера с голосовым управлением и софт DeepFace для распознавания людей на фото и видеозаписях с точностью в 97%. Последние две функции явно созданы для «парной работы», так же как и сканирование, распознавание и чтение искусственным интеллектом книг в Google.

В мире появится аналог Skynet?

Вопросы о том, ждет ли нас в итоге универсальный помощник для просчета вариантов и принятии верных решений (незаменимый, к примеру, в современной медицине) или же всеведующий аналог деструктивного Skynet, был поставлен еще в документальном фильме Би-би-си «Google и всемирный мозг» 2013 года. При этом уже сейчас понятно, что основная битва на рынке систем ИИ произойдет между титанами Google, Facebook и Microsoft, которые будут охотно поглощать и ассимилировать успешные и яркие разработки независимых компаний — аналогично тому, как команда DeepMind влилась в команду Главного Поисковика. Пока в этой гонке по всем параметрам лидирует Google, и победа в го — еще один шаг на пути к искусственному интеллекту уровня Саманты из недавнего фильма «Она» Спайка Джонза (если повезет) или HAL 9000 — если везение нас оставит. Кто знает, может быть, именно DeepMind с его способностью к глубокому анализу поможет Google окончательно расправиться с конкурентами и монополизировать рынок.

Денис Ефремов

психолог, гештальт-терапевт (www.psy-de.ru), КМС по шахматам

«Сегодняшний мир — это мир, в котором технологии интегрированы повсюду, и спортивные состязания не стоят в стороне. Прошло почти 20 лет с момента победы Deep Blue над великим Гарри Каспаровым. Это был один из первых ударов по самолюбию людей — выяснилось, что мы уже не самые умные на планете. Однако и сегодня шахматные программы все еще обслуживают шахматистов, а не наоборот. Другими словами, человечество научилось тому, как использовать шахматные программы, играющие сильнее любых гроссмейстеров, для подготовки, тренировки, анализа дебютов и помощи комментаторам турниров. Думаю, что если не в этот раз, так позже железный друг победит чемпионов мира и в го. Но это ничего не изменит в значимости соревнований среди людей. Потому что нам интересно соревноваться друг с другом, интересно смотреть на это. Болеть хочется за кого-нибудь живого, из плоти и крови. И хочется восхищаться способностями людей, ну и завидовать им — тем, кто способен быть лучшим в своем деле. Хотя, конечно, любопытно, сколько еще времени чемпионы мира в го смогут удерживать человеческое превосходство над компьютером. Ведь это один из последних рубежей».

Еще три важные победы компьютера над человеком

1994 год — Chinook побеждает Мариона Тинсли в шашки

jonathanschaeffer.blogspot.ru

В 1989 году сотрудники Альбертского университета — Джонатан Шеффер, Роб Лейк, Поль Лу, Мартин Брайант и Норман Трелоар — создали компьютерную программу под названием Chinook. Именно Chinook было суждено отнять у людей титул чемпиона мира по шашкам. Сперва программа упрочила свои позиции в мировом рейтинге игроков, заняв в 1990 году на Открытом чемпионате США второе место после Мариона Тинсли — американского шашиста, восьмикратного чемпиона мира по чекерсу (английский вариант шашек).

Американская федерация шашек и Английская ассоциация шашек не хотели допускать матча между Марионом Тинсли и программой Chinook (возможно, однажды этот факт будет рассматриваться как пример белково-кремниевого национализма). Смельчак Тинсли в знак протеста подал в отставку, и обеим федерациям пришлось уступить. Так в сетке больших шашечных игр появилась новая категория: «Мировой чемпионат человека против машины». В первом матче Тинсли удалось уложить Chinook на лопатки — несмотря на 33 ничьих, четыре чистые победы были за человеком и только две — за компьютером. В августе 1994-го начался матч-реванш, но после шести ничьих Тинсли выходит из состязания. К несчастью, виной тому была не тактическая хитрость, а болезнь чемпиона — 3 апреля 1995 года он умер от рака поджелудочной железы. Формально Chinook стал чемпионом мира по шашкам в категории «Человек — машина», а, что называется, по гамбургскому счету — Марион Тинсли остался непобежденным.

Chinook не скучал без столь сильного противника — в 1995 году защитил титул в игре с Доном Лафферти, был «на пенсии» с 1997 по 2001 год, попутно набирался ума и впитывал все новые комбинации (которых каждая шашка дает 39 миллиардов для конца игры). 19 июля 2007 года команда все того же Джонатана Шеффера опубликовала в журнале Science знаменитую статью «Checkers Is Solved» («Шашки решены»). В материале приводились доказательства того, что после доработки алгоритма Chinook лучший в мире шашист может достичь максимум ничьей. Самые смелые (и наивные) могут испытать свои силы против цифрового ветерана шашек на сайте Альбертского университета. Остальные могут почитать книгу Джонатана Шеффера «One Jump Ahead: Challenging Human Supremacy in Checkers» («Один скачок вперед: Борьба с человеческим преимуществом в шашках»), обновленная версия которой вышла в ноябре 2008 года.

1997 год — Deep Blue побеждает Гарри Каспарова в шахматах

Bernie Nunez / Gettyimages.ru

Шахматная война человека с компьютером идет больше полувека — первый матч с компьютером MANIAC был проведен в 1956 году, а полный список баталий можно посмотреть здесь. Ключевыми событиями этой войны остаются матчи с Гарри Каспаровым, когда-то сказавшим: «В классических шахматах на серьезном уровне компьютерам ничего не светит в XX веке». 22 октября 1989 года Гарри Каспаров принял вызов и сразился с суперкомпьютером Deep Thought — предвестником Deep Blue.

В те времена компьютеры были слабы в позиционной игре, что активно использовали гроссмейстеры, в том числе советский чемпион. Разгромив Deep Thought, Каспаров также хладнокровно расправился с немецкой программой Fritz 3. Зато в 1994 году чемпиону пришлось тяжко: на турнире Intel в Лондоне он проиграл программе ChessGenius одну партию, а вторую свел в ничью. Правда, сам ChessGenius был сокрушен в полуфинале, что помешало объявить компьютер победителем чемпионата. После серии отыгрышей в 1996 году Каспаров наконец предстал перед Deep Blue в Филадельфии.

Первая встреча принесла Каспарову победу, но во второй — легендарной — 1997 года чемпион проиграл со счетом 2,5 — 3,5. Матч проходил на 35-м этаже небоскреба Equitable Building. Компьютер работал «с комфортом»: отдельная комната и отдельный судья, 510 процессоров и отлаженная за год программа позволила Deep Blue выиграть у Каспарова, гневу которого не было предела. На церемонии закрытия бывший чемпион обвинил команду Deep Blue в том, что профессиональные игроки подсказывали ходы компьютеру, и потребовал у IBM лог-файлы партии — в чем ему на тот момент отказали.

В книге 2012 года «The Signal and the Noise» Нейта Силвера, специалиста по статистике и журналиста The New York Times, рассматривалась смелая гипотеза: вероятно, ошибка кода, которая спровоцировала компьютер на случайный 44-й ход, позволила Deep Blue смутить Гарри Каспарова «тонкой стратегией» и одержать победу. Подробную историю всех столкновений Гарри Каспарова с искусственным интеллектом можно (и нужно) прочесть здесь, а заодно посмотреть документальный фильм Викрама Джаянти «Game Over: Kasparov and the Machine» (2003). В 2013 году вездесущий Disney запустил новость о подготовке байопика по пьесе Мэтта Чэрмена «Машина», сюжет которой повторяет события 1997 года. К сожалению, проект до сих пор не был осуществлен.

2011 — Watson побеждает Брэда Раттера и Кена Дженнингса в «Jeopardy!»

en.wikipedia.org

«Jeopardy!» — это телевизионная игра-викторина, известная в России с 1994 года под именем «Своя игра». В США программа выходит с 30 марта 1964 года на канале NBC. Слава ее автора — Мерва Гриффина — дошла до России окольными путями: его композиция «House of Horrors» (1962) звучала в любимом мультфильме про Карлсона. Другая его передача — «The Wheel of Fortune» — надолго поселится на первой кнопке телевизора в виде капитал-шоу «Поле чудес».

Телевикторина «Jeopardy!» стала золотой жилой для Мерва Гриффина — она выходила 5 раз в неделю, давала около 225 игр в год, а число вопросов за всю историю передачи перевалило за полмиллиона. «Jeopardy!» стала краегольным камнем в строительстве медиаимперии, которую Гриффин, уходя на пенсию в 1986 году, продал за четверть миллиона долларов.

Несмотря на серьезный конфликт IBM и руководства шоу в мае 2010 года, уже в феврале 2011-го суперкомпьютер IBM под названием Watson (в честь основателя IBM Томаса Уотсона) принял участие в телепередаче «Jeopardy!». Машина была оснащена вопросно-ответной системой искусственного интеллекта и представляла целый программный комплекс на кластере из десяти стоек по девять стандартных серверов IBM Power 750 на базе процессоров POWER7. Watson мог обрабатывать естественную речь, искать информацию, моделировать рассуждения, а его создание было частью проекта DeepQA — системы контентной аналитики. Подводя итог — у Брэда Раттера (самый большой выигрыш в программе) и Кена Дженнингса (рекорд по серии выигранных игр) было не так много шансов. Хотя Watson не имел доступа к интернету, его оперативная память — более 15 терабайт, а также 200 миллионов страниц структурированной и неструктурированной информации объемом в 4 терабайта, включая полный текст «Википедии», мягко говоря, помогли команде IBM и Дэвида Ферруччи. Компьютер устроил прекрасное шоу, выиграл миллион долларов, а Дженнингс и Раттер получили «утешительные» 300 и 200 тысяч.

Важно отметить, что Watson не просто умная игрушка. Основа суперкомпьютера Watson, а также наработки IBM и Nuance Communications (производителя средств распознавания речи) лягут в основу полноценного искусственного интеллекта. Последний сможет помогать в принятии решений: диагностировании и лечении пациентов в больницах, оценивать политику страхования и эффективность энергопотребления. Что же касается победы в «Jeopardy!» — узнать подробности феерической победы Watson можно благодаря Стивену Бейкеру и его книге 2012 года «Final Jeopardy: The Story of Watson, the Computer That Will Transform Our World» («Последний «Jeopardy»: История Watson — компьютера, который изменит наш мир»).