Конгломерат социальных сетей Meta, создает "суперкомпьютер с искусственным интеллектом" — высокоскоростной компьютер, разработанный специально для систем машинного обучения. Компания заявляет, что ее новый AI Research SuperCluster, или RSC, уже является одной из самых быстрых машин такого типа и, когда он будет завершен в середине 2022 года, станет самым быстрым в мире.
"Meta разработала то, что мы считаем самым быстрым в мире суперкомпьютером с искусственным интеллектом", — заявил генеральный директор Meta Марк Цукерберг. "Мы называем его RSC for AI Research SuperCluster, и он будет завершен в конце этого года".
Такие конкуренты, как Microsoft и Nvidia, ранее уже анонсировали свои собственные "суперкомпьютеры с искусственным интеллектом", которые немного отличаются от того, что мы считаем обычными суперкомпьютерами. RSC будет использоваться для обучения ряда систем в подразделениях Meta: от алгоритмов модерации контента, используемых для обнаружения провокационных сообщений в Facebook и Instagram, до функций дополненной реальности, которые однажды будут доступны в будущем оборудовании AR компании. И да, Meta говорит, что RSC будет использоваться для метавселенной — настойчивого брендинга компании для серии взаимосвязанных виртуальных пространств, от офисов до онлайн-арен.
"RSC поможет исследователям искусственного интеллекта Meta создавать новые и более совершенные модели искусственного интеллекта, которые могут учиться на триллионах примеров; работать на сотнях разных языков; легко анализировать текст, изображения и видео вместе; разрабатывать новые инструменты дополненной реальности; и многое другое", — пишут инженеры Meta Кевин Ли и Шубхо Сенгупта в сообщении новостного блога компании. "Мы надеемся, что RSC поможет нам создать совершенно новые системы искусственного интеллекта, которые могут, например, обеспечивать голосовой перевод в реальном времени для больших групп людей, говорящих на разных языках, чтобы они могли беспрепятственно сотрудничать в исследовательском проекте или совместно играть в игру с дополненной реальностью."
Работа над RSC началась полтора года назад, когда инженеры Meta проектировали различные системы машины — охлаждение, питание, сеть и кабели — полностью с нуля. Первая фаза RSC уже запущена и состоит из 760 систем Nvidia GGX A100, содержащих 6080 подключенных графических процессоров (тип процессора, который особенно хорошо справляется с задачами машинного обучения). Meta заявляет, что уже обеспечивает до 20 раз более высокую производительность при выполнении своих стандартных исследовательских задач в области машинного зрения.
Однако до конца 2022 года будет завершена вторая фаза RSC. На тот момент он будет содержать около 16 000 графических процессоров и сможет обучать системы искусственного интеллекта "с более чем триллионом параметров на наборах данных размером до эксабайта". (Это необработанное количество графических процессоров обеспечивает лишь узкую метрику общей производительности системы, но для сравнения: суперкомпьютер Microsoft с искусственным интеллектом, созданный с помощью исследовательской лаборатории OpenAI, состоит из 10 000 графических процессоров.)
Все эти цифры очень впечатляют, но они вызывают вопрос: что вообще такое суперкомпьютер с искусственным интеллектом? И как это соотносится с тем, что мы обычно называем суперкомпьютерами — огромными машинами, развернутыми университетами и правительствами для обработки чисел в таких сложных областях, как космос, ядерная физика и изменение климата?
Два типа систем, известных как высокопроизводительные компьютеры или высокопроизводительные компьютеры, безусловно, больше похожи, чем различны. Оба они ближе к центрам обработки данных, чем отдельные компьютеры по размеру и внешнему виду, и полагаются на большое количество взаимосвязанных процессоров для обмена данными на невероятно высоких скоростях. Но между ними есть ключевые различия, как объясняет The Verge аналитик высокопроизводительных вычислений Боб Соренсен из Hyperion Research. "HPC на основе ИИ живут в несколько ином мире, чем их традиционные аналоги HPC", — говорит Соренсен, и большое отличие заключается в точности.
Проще говоря, машинное обучение требует меньшей точности, чем задачи, поставленные перед традиционными суперкомпьютерами, поэтому "суперкомпьютеры с искусственным интеллектом" могут выполнять больше вычислений в секунду, чем их обычные собратья, использующие то же оборудование. Это означает, что когда Meta говорит, что построила "самый быстрый в мире суперкомпьютер с искусственным интеллектом", это не обязательно прямое сравнение с суперкомпьютерами, которые вы часто видите в новостях (рейтинги которых составляются независимым Top500.org и публикуются два раза в год).
Иван Ковалев
VIA