Суперкомпьютер HPE Cray Frontier, который должен быть запущен в OLCF до конца года, получит умопомрачительную подсистему хранения

Окриджский компьютерный центр (Oak Ridge Leadership Computing Facility или OLCF), принадлежащий министерству энергетики США, анонсировал спецификации систем хранения для своего суперкомпьютера HPE Cray Frontier, системы экзафлопсного класса, которая должна быть запущена к концу года.

Ожидается, что этот суперкомпьютер, способный выполнять 1018 вычислений в секунду, сделает возможным прорывные открытия в широком спектре научных дисциплин — от основ создания более совершенных ядерных реакторов до понимания происхождения Вселенной. Его подсистема ввода-вывода будет состоять из двух основных компонентов: хранилища внутрисистемного уровня и файловой системы всего центра. Файловая система Orion, охватывающая весь центр, будет использовать технологии Lustre и ZFS с открытым исходным кодом. Это будет самая большая и быстрая файловая система с плоским пространством имен POSIX в мире.

В состав системы войдут 5400 твердотельных накопителей NVMe суммарным объемом 11,5 ПБ. Они обеспечат пиковые скорости чтения и записи 10 ТБ/с и производительность более 2 млн IOPS на операциях чтения с произвольным доступом. На следующем уровне будет 47 700 накопителей на жестких магнитных дисках, в которых используется технология перпендикулярной магнитной записи. Их суммарный объемом составит 679 ПБ, пиковая скорость чтения будет достигать 5,5 ТБ/с, а пиковая скорости записи — 4,6 ТБ/с. Что до производительности на операциях чтения с произвольным доступом, она будет достигать 2 млн IOPS. Помимо этого будет уровень метаданных, сформированный из 480 твердотельных накопителей NVMe суммарным объемом 10 ПБ.

Orion будет иметь 40 серверных узлов метаданных Lustre и 450 узлов службы хранилища объектов Lustre (OSS). Каждый узел OSS будет включать одно устройство хранения объектов (OST), оптимизированное по производительности, и два, оптимизированных по объему, — всего 1350 устройств в масштабах всей системы. Дополнительные 160 узлов будут служить маршрутизаторами для обеспечения пиковой скорости чтения-записи 3,2 ТБ/с для всех других ресурсов и платформ OLCF.

На уровне внутрисистемного хранилища будут использоваться локальные устройства хранения вычислительных узлов, подключенные через каналы PCIe Gen4, позволяющие получить пиковую скорость чтения более 75 ТБ/с, пиковую скорость записи более 35 ТБ/с и производительность более 15 млрд IOPS на операциях чтения и записи с произвольным доступом. Инженеры OLCF работают над программными решениями, чтобы обеспечить распределенное пространство имен для устройств для каждого задания.