Хочешь победить в конкуренции — считай!
Материал подготовила Татьяна Зимина
В конце ноября 2024 года в Институте программных систем им. А. К. Айламазяна РАН состоялся тринадцатый Национальный суперкомпьютерный форум (НСКФ-2024).
В конце ноября 2024 года в Институте программных систем им. А. К. Айламазяна РАН (ИПС РАН, г. Переславль-Залесский) состоялся тринадцатый Национальный суперкомпьютерный форум (НСКФ-2024), собравший специалистов из 56 организаций. Традиционно на Форуме обсуждали состояние и перспективы развития российской и мировой суперкомпьютерной отрасли, проблемы создания и применения суперкомпьютерных, грид- и облачных технологий. Специалисты — участники научно-практической конференции вынуждены были констатировать, что отрасль в нашей стране переживает не самые простые времена.За прошедший год (с ноября 2023 года) в полтора раза сократилась доля России в суммарной производительности земного шара по рейтингу Тор500 и в полтора раза уменьшился коэффициент цифровизации экономики. С этих данных начал свой доклад член-корреспондент РАН, доктор физико-математических наук Сергей Михайлович Абрамов, главный научный сотрудник ИПС им. А. К. Айламазяна РАН на пресс-конференции, прошедшей во время Форума.
Сергей Михайлович рассказал, что суперкомпьютеры появились ещё в 1940—1950-х годах и развивались как отдельная ветка ИТ-отрасли. В нынешней ситуации суперкомпьютерные технологии — единственный инструмент победы в конкуренции. То есть страна, желающая победить в конкуренции, обязана быть первой в вычислениях. Это связано с тем, что мир находится в постиндустриальной эпохе, и для нового технологического уклада требуется новая инфраструктура — государственная сеть мощных национальных суперкомпьютерных центров, объединённых сверхбыстрыми каналами связи в единую систему, плюс персонал, сервисы и правовое регулирование. «В век пара нужно строить железные дороги, в век электричества — электрифицировать страну, в век углеводородов — прокладывать магистральные нефтепроводы, газопроводы, в постиндустриальный век — возводить суперкомпьютерные центры, подключённые к мощным линиям электропередачи и образующие единую информационную среду», — пояснил Сергей Абрамов.
Суперкомпьютерная индустрия включает в себя суперкомпьютерное образование, производителей суперкомпьютеров и тех, кто их использует (бизнес, науку, оборонные и силовые структуры), и без участия государства существовать не может. То есть именно государство должно вкладываться в её развитие. В США с 2005 года на создание и содержание СК-индустрии из бюджета (как из федерального, так и регионального) тратится от 2 до 6 млрд долларов в год. Другой пример — Китайская Народная Республика. В 2016 году самым мощным суперкомпьютером в мире был китайский Sunway TaihuLight. Он построен за 210 млн долларов, из которых 70 млн выделили из федерального бюджета, 70 млн — из бюджета региона (области) и 70 млн — из бюджета райцентра. Потраченные деньги возвращаются в бюджет в виде налогов, ведь с помощью суперкомпьютеров получают новые знания, технологии, изделия.
Сергей Абрамов остановился на том, что такое, собственно, суперкомпьютер: «Если открыть Википедию, то найдёте, что это самая мощная вычислительная система. Понятно, что речь идёт о производительности — количестве операций в секунду. Причём важна реальная производительность (обозначается Rmax), достигнутая на реальной задаче, а не пиковая, не имеющая никакого отношения к жизни. И на разных задачах одна и та же установка может показывать разную реальную производительность».
Но можно ли сказать, что суперкомпьютер — это самая производительная система в каждый момент времени? «В этом случае в мире будет один суперкомпьютер, что не хорошо. Их должно быть несколько», — сказал Сергей Михайлович. Сколько именно? Много лет назад, в 1993 году, остановились на цифре 500 самых производительных систем, их и стали называть суперкомпьютерами. Так был организован рейтинг Тор500, который обновляется каждые полгода. Однако тут есть нюанс: не все реально существующие установки подают заявки на вхождение в Тор500 — из соображений национальной безопасности и по разным другим причинам. «Поэтому окончательная редакция такая: суперкомпьютер — это система, имеющая реальную производительность, которая соответствует производительности машин, включённых в соответствующую по времени редакцию списка Тор500», — заключил С. Абрамов.
Как формировалась суперкомпьютерная индустрия, а вместе с ней и менялся список Тор500? Долгое время рост был очень бурным, отрасль развивалась по экспоненте. Примерно каждые 11 лет производительность увеличивалась в тысячу раз. Но затем из-за технических трудностей этот рост замедлился (табл. 1).
Что же такое увеличение производительности в тысячу раз каждые 11 лет? «Представьте себе, что подобная ситуация была бы в автомобильной промышленности. То есть если в 1917 году автомобили ездили со скоростью 10 км/ч, то в 1928-м их скорость была бы 10 000 км/ч — в восемь с лишним раза быстрее скорости звука в воздухе. По прошествии ещё 11 лет — это всего лишь 1939 год — автомобили бы ездили со скоростью 10 млн км/ч. И если этот ряд продолжить, то автомобили в прошлом веке должны были превысить даже не первую, а вторую или третью космические скорости, а ещё через один цикл стать гораздо быстрее, чем скорость света. Понятно, что ни в одной отрасли в мире ничего подобного не наблюдается. А в суперкомпьютерной индустрии мы это видим в течение очень большого периода времени», — подчеркнул Сергей Михайлович.
Главным применением суперкомпьютеров на протяжении десятилетий было машинное моделирование для решения инженерных и научных задач, в котором используются операции над дробными числами, числами с плавающей точкой двойной точности*. Поэтому за единицу измерения производительности принят флопс (FLOPS) — количество операций с плавающей точкой в секунду.
Сегодня самые мощные суперкомпьютеры перешли рубеж в 1018 операций в секунду — эта величина называется эксафлопс. «Теперь мы руководствуемся лозунгом „улучшение производительности в 1000 раз примерно за 17—20 лет”. Это объясняет, почему отодвинулось преодоление эксафлопсного рубежа, которое случилось только в 2022 году, а не в 2019, как можно было ожидать. И зетафлопс (1021 операций в секунду) надо ожидать примерно в 2036 году», — отметил С. Абрамов.
На ноябрь 2024 года самым мощным суперкомпьютером был американский El Capitan. Он размещён в Ливерморской национальной лаборатории им. Э. Лоуренса, его производительность достигает 1,742 эксафлопса, что на 35% превосходит возможности предыдущего лидера, также американского суперкомпьютера Frontier с производительностью 1,102 эксафлопса. Всего же на сегодня, помимо El Capitan и Frontier, системы эксафлопсного перехода — это американские Aurora и Eagle, а также японская машина Fugaki. Напомним, что речь идёт о машинах, включённых в публичный список Tор500, то есть в мире, возможно, есть и другие («непубличные») системы с подобной (и даже большей) производительностью.
Сергей Абрамов подчеркнул, что системы, вошедшие в Тор500 (ноябрь 2024 года), очень различаются по производительности. Например, первые 101 машина (20%) из рейтинга Тор500 дают 85% мировой производительности. Одновременно половина списка (то есть 250 суперкомпьютеров) имеет производительность, составляющую всего 0,2% от производительности лидера El Capitan. «Это более чем в полтысячи раз хуже, чем Тор1. Что такое отличие в 500 раз? Представьте, у вас есть транспортное средство, которое ездит со скоростью 10 км/с, и есть транспортное средство, которое ездит в 500 раз быстрее — 5000 км/с. Могут ли они быть устроены одинаково?» — разъясняет Сергей Абрамов.
А что же в России? Всего с 2002 по 2014 год в Tор500 попали 14 публичных суперкомпьютеров, которые были произведены в нашей стране (табл. 2). Из них шесть — это СКИФы, сделанные по государственной программе Союзного государства Россия-Беларусь, в которой участвовали 37 компаний, головным институтом был ИПС им. А. К. Айламазяна РАН. «Это показывает, насколько важно для отрасли наличие серьёзных государственных и межгосударственных программ. Хотя на программу союзного государства России и Беларуси «СКИФ-ГРИД», рассчитанную на десять лет, из бюджета потрачено всего 500 миллионов рублей. Но удалось сделать очень много», — подчеркнул Сергей Михайлович Абрамов. И ещё раз напомнил, что в рейтинге пятисот самых производительных машин сведения неполные. Тем не менее на них можно опираться — по аналогии с айсбергами, размер которых можно оценить, глядя лишь на надводную часть. Единственное исключение — это Китай, которому пришлось «спрятать» свои суперкомпьютеры после наложения санкций на несколько успешных компаний.
После 2014 года в списке Tор500 остаётся единственная машина отечественной разработки, построенная на государственные деньги, — «Ломоносов-2». Она как раз одна из тех систем, которые более чем в 500 раз медленнее, чем сегодняшний лидер. «Находиться в рейтинге Тор500 десять с половиной лет — это рекорд. Но в то же время «Ломоносов-2» давным-давно надо списать, учитывая его характеристики. Нормальная жизнь для вычислительной техники — пять лет. То, что мы его держим, он работает, говорит о том, что он качественно построен», — подчеркнул Сергей Михайлович.
Всего же в рейтинг Тор500 последней редакции вошли шесть машин, работающих в России. Это три суперкомпьютера Яндекса («Червоненкис», «Галушкин» и «Ляпунов»), который сегодня обладает примерно 70% всей вычислительной мощи страны. Две машины есть у Сбербанка — «Кристофари» и «Кристофари нео». Все эти суперкомпьютеры созданы для решения задач корпораций, хотя они используются и для нужд сторонних организаций по определённым правилам и регламенту.
Суперкомпьютер MTS GROM, покинувший список самых высокопроизводительных компьютеров мира в 2024 году, продержался в нём два года.
Сколько вычислительной мощности было доступно России, Китаю, Евросоюзу, Японии и США в разное время? В 2000 году ни у России, ни у Китая не было ни одной суперкомпьютерной системы. В 2002 и 2008 годах по количеству вычислительной суперкомпьютерной мощности Россия и Китай были в одинаковой позиции. А далее КНР набирает темп и с 2013 года имеет примерно равные суперкомпьютерные мощности с Евросоюзом. С 2013 по 2016 год чуть вперёд вырываются то Китай, то США — идёт гонка. И, наконец, КНР строит полностью отечественную машину, которая становится Тор1 в списке Тор500 на несколько полугодий. После чего американское правительство 11 суперкомпьютерных китайских компаний-производителей включает в санкционный список, и Китай перестаёт публиковать в списке Тор500 свои новые построенные машины.
Россия, будучи в 2008 году по суммарной вычислительной мощности равной Китаю, от Японии отставала на 2,5 года, от Евросоюза — на 4 года и на 5,5 года от США. Сегодня отставание от США составляет 12,5 года, от Евросоюза — 10, от Японии — 9 лет и от Китая — 7,5 года.
Другой важнейший практический параметр — доля мирового «пирога»: сколько процентов вычислительной мощности земного шара приходится на Россию. Лучшие наши показатели были в 2000, 2009 и 2010 годах — 2,5, 2,52 и 2,5% соответственно. Самое глубокое падение пришлось на 2019 год — это 0,22%. Благодаря усилиям Яндекса, Сбербанка и МТС наша страна за полгода «прыгнула» до 2,4%, но в последующие 2,5 года опустилась до 0,61%.
Если посмотреть на суперкомпьютерную инфраструктуру, то у всех обсуждаемых стран она хорошо развита и структурирована. Есть машины, используемые в науке, промышленности (то есть те, что стоят непосредственно в производственной цепочке, в том числе цифровые двойники), для государственных нужд и обороны. У России киберинфраструктуры сейчас практически нет. Есть только суперкомпьютеры, купленные корпорациями, и лишь один «Ломоносов-2» используется для получения новых знаний.
Итак, мы находимся в постиндустриальной эре. Одна из моделей постиндустриального развития — цифровая экономика, и это означает, что мы делаем всё больше вычислений. Чтобы оценить, сколько производится вычислений на объём выпущенной продукции, используется индекс (коэффициент) цифровизации. При его вычислении объём продукции, которую выпустил в течение года земной шар, принят за единицу, а объём продукции страны есть доля данной страны в мировом ВВП. Аналогично все вычисления, сделанные в мире за год, — это также единица. Объём вычислений той или иной страны рассчитывается как её доля в суммарной производительности, умноженная на количество секунд в году. (Количество секунд в году примерно π x 107.) Индекс цифровизации — объём вычислений на единицу продукции. Чтобы его определить, достаточно долю страны в суммарной производительности разделить на долю страны в суммарном ВВП:
Кц = Сделано вычислений/выпущено продукции = Доля страны в ΣRmax/Доля страны в ΣВВП.
Коэффициент цифровизации земного шара всегда равен единице. Если у страны индекс выше единицы — она лидер цифровизации, если ниже, её уровень ниже среднего.
Больше половины всех вычислений в мире приходится на США — их индекс цифровизации 2,13, у Японии — 2,01, у Евросоюза — 1,3 и у России — 0,31 (табл. 3). То есть мы считаем в три раза меньше, чем в среднем в мире, и в 4,5 раза меньше, чем четвёрка лидеров.
Как использовались суперкомпьютеры раньше и сегодня? Если смотреть в штуках, то было время, когда более половины машин в мире работали в индустрии. Если же оценивать в суммарной производительности, то во все годы более 60% суперкомпьютеров использовали для получения новых знаний, которые, в свою очередь, позволяют разрабатывать новые технологии, новые изделия, применяемые затем в индустрии. На саму индустрию приходится сегодня лишь 20% вычислительной мощности мира.
Какие главные технологические задачи стоят перед отраслью? «Первая проблема — не увеличение количества ядер в суперкомпьютерах, не ускорительность, не что-либо ещё, а энергоэффективность», — сообщил Сергей Абрамов. — Как создать микросхемы, системы охлаждения, которые потребляли бы меньше энергии? И как построить блоки питания с КПД, близким к 100%?».
Вторая по важности задача — повышение производительности интерконнекта, то есть коммуникационной сети, объединяющей вычислительные узлы суперкомпьютера в единое целое.
Далее по значимости идут развитие технологий памяти, масштабируемое системное программное обеспечение, операционная система, новые языки, новые алгоритмы…
Одной из первостепенных задач Сергей Михайлович назвал повышение производительности учёных: «Важна не производительность программистов, а производительность учёных. Учёные должны меньше тратить времени от постановки задачи до получения результата».
Есть ли в России результаты переднего края по решению технологических задач, стоящих перед суперкомпьютерной отраслью? Есть, это, например, системы электропитания и система с жидкостным охлаждением и кипением (см. «Наука и жизнь» № 1, 2021 г., статья «Суперкомпьютеры 2020: рекорды, разочарования и непреодолимые барьеры»), которая по разным характеристикам лучше систем охлаждения в суперкомпьютерах из сегодняшнего списка Тор500.
Существенный скачок в развитии индустрии могут дать фотонные вычислительные машины, и в этом направлении у нас тоже есть успехи. Представленные на нынешнем Форуме результаты говорят о том, что фотонные машины с производительностью, равной суперкомпьютеру Тор1, займут всего пол-литра объёма и будут потреблять лишь 100 Вт. В то время как лидер сегодняшнего рейтинга Тор500 имеет размер с машинный зал и потребляет 30 МВт энергии. При этом в фотонной машине, в отличие от электронной, на одном и том же процессоре можно запускать одновременно несколько задач. «Мало того, что фотонная машина в десять тысяч раз быстрее, чем обычная, на ней можно вести параллельные вычисления, что невозможно в электронном виде. Ну, нельзя на одном и том же чипе на разных частотах запустить разные задачи. А тут можно. Это фантастика», — пояснил Сергей Абрамов и подчеркнул, что достигнутые технические решения в нашей стране уже подтверждены патентами, а также напомнил, что есть решение предыдущего Форума о необходимости финансирования этого технологического направления развития.
«Проблем много, нет серьёзных государственных программ, — с сожалением отметил Сергей Михайлович Абрамов. — Время от времени пишется документ под названием „План развития суперкомпьютерной инфраструктуры России”. Но её нет. Что развивать?». По мнению Сергея Михайловича, не надо строить отдельно суперкомпьютерную инфраструктуру для России. Есть проект межгосударственной программы создания суперкомпьютерной инфраструктуры и её сопровождение в развитии для Евразийского экономического сообщества, что правильно, и уже пора выдать подробный план работы и сразу приступить к реализации программы.
Иллюстрации и таблицы предоставлены ИПС им. А. К. Айламазяна РАН.
Комментарии к статье
* Числа с плавающей точкой двойной точности — экспоненциальная форма представления действительных чисел.
Читайте в любое время