Окриджский компьютерный центр (Oak Ridge Leadership Computing Facility или OLCF), принадлежащий министерству энергетики США, анонсировал спецификации системы хранения для своего суперкомпьютера экзафлопсного класса HPE Cray Frontier, который должен быть запущен к концу года.
Ожидается, что этот суперкомпьютер, способный выполнять 1018 вычислений в секунду, сделает возможным прорывные открытия в широком спектре научных дисциплин — от основ создания более совершенных ядерных реакторов до понимания происхождения Вселенной. Его подсистема ввода-вывода будет состоять из двух основных компонентов: хранилища внутрисистемного уровня и файловой системы всего центра. Файловая система Orion, охватывающая весь центр, будет использовать технологии Lustre и ZFS с открытым исходным кодом. Это будет самая большая и быстрая файловая система с плоским пространством имён POSIX в мире.
В состав системы войдут 5400 твердотельных накопителей NVMe суммарным объёмом 11,5 ПБ. Они обеспечат пиковые скорости чтения и записи 10 ТБ/с и производительность более 2 млн IOPS на операциях чтения с произвольным доступом. На следующем уровне будет 47 700 накопителей на жёстких магнитных дисках, в которых используется технология перпендикулярной магнитной записи. Их суммарный объём составит 679 ПБ, пиковая скорость чтения будет достигать 5,5 ТБ/с, а пиковая скорость записи — 4,6 ТБ/с. Что до производительности на операциях чтения с произвольным доступом, она будет достигать 2 млн IOPS. Помимо этого, будет уровень метаданных, сформированный из 480 твердотельных накопителей NVMe суммарным объёмом 10 ПБ.
Orion будет иметь 40 серверных узлов метаданных Lustre и 450 узлов службы хранилища объектов Lustre (OSS). Каждый узел OSS будет включать одно устройство хранения объектов (OST), оптимизированное по производительности, и два, оптимизированных по объёму, — всего 1350 устройств в масштабах всей системы. Дополнительные 160 узлов будут служить маршрутизаторами для обеспечения пиковой скорости чтения-записи 3,2 ТБ/с для всех других ресурсов и платформ OLCF.
На уровне внутрисистемного хранилища будут использоваться локальные устройства хранения вычислительных узлов, подключённые через каналы PCIe Gen4, позволяющие получить пиковую скорость чтения более 75 ТБ/с, пиковую скорость записи более 35 ТБ/с и производительность более 15 млрд IOPS на операциях чтения и записи с произвольным доступом. Инженеры OLCF работают над программными решениями, чтобы обеспечить распределённое пространство имён для устройств для каждого задания.