Суперкомпьютер HPE Cray Frontier, который должен быть запущен в OLCF до конца года, получит умопомрачительную подсистему хранения

Окриджский компьютерный центр (Oak Ridge Leadership Computing Facility или OLCF), принадлежащий министерству энергетики США, анонсировал спецификации системы хранения для своего суперкомпьютера экзафлопсного класса HPE Cray Frontier, который должен быть запущен к концу года.

Ожидается, что этот суперкомпьютер, способный выполнять 1018 вычислений в секунду, сделает возможным прорывные открытия в широком спектре научных дисциплин — от основ создания более совершенных ядерных реакторов до понимания происхождения Вселенной. Его подсистема ввода-вывода будет состоять из двух основных компонентов: хранилища внутрисистемного уровня и файловой системы всего центра. Файловая система Orion, охватывающая весь центр, будет использовать технологии Lustre и ZFS с открытым исходным кодом. Это будет самая большая и быстрая файловая система с плоским пространством имён POSIX в мире.

В состав системы войдут 5400 твердотельных накопителей NVMe суммарным объёмом 11,5 ПБ. Они обеспечат пиковые скорости чтения и записи 10 ТБ/с и производительность более 2 млн IOPS на операциях чтения с произвольным доступом. На следующем уровне будет 47 700 накопителей на жёстких магнитных дисках, в которых используется технология перпендикулярной магнитной записи. Их суммарный объём составит 679 ПБ, пиковая скорость чтения будет достигать 5,5 ТБ/с, а пиковая скорость записи — 4,6 ТБ/с. Что до производительности на операциях чтения с произвольным доступом, она будет достигать 2 млн IOPS. Помимо этого, будет уровень метаданных, сформированный из 480 твердотельных накопителей NVMe суммарным объёмом 10 ПБ.

Orion будет иметь 40 серверных узлов метаданных Lustre и 450 узлов службы хранилища объектов Lustre (OSS). Каждый узел OSS будет включать одно устройство хранения объектов (OST), оптимизированное по производительности, и два, оптимизированных по объёму, — всего 1350 устройств в масштабах всей системы. Дополнительные 160 узлов будут служить маршрутизаторами для обеспечения пиковой скорости чтения-записи 3,2 ТБ/с для всех других ресурсов и платформ OLCF.

На уровне внутрисистемного хранилища будут использоваться локальные устройства хранения вычислительных узлов, подключённые через каналы PCIe Gen4, позволяющие получить пиковую скорость чтения более 75 ТБ/с, пиковую скорость записи более 35 ТБ/с и производительность более 15 млрд IOPS на операциях чтения и записи с произвольным доступом. Инженеры OLCF работают над программными решениями, чтобы обеспечить распределённое пространство имён для устройств для каждого задания.