NVIDIA випустила нове покоління суперкомп’ютерних чіпів зі штучним інтелектом, які, ймовірно, відіграватимуть важливу роль у майбутніх проривах у глибокому навчанні та великих мовних моделях (LLM), таких як OpenAI GPT-4. Ця технологія представляє собою значний стрибок у порівнянні з попереднім поколінням і буде використовуватися в центрах обробки даних і суперкомп’ютерах для вирішення таких завдань, як прогнозування погоди та клімату, пошук ліків, квантові обчислення і багато іншого.
Ключовим продуктом є графічний процесор HGX H200 на базі архітектури NVIDIA “Hopper”, який прийшов на зміну популярному графічному процесору H100. Це перший чіп компанії, що використовує пам’ять HBM3e, яка працює швидше та має більший об’єм, що робить його більш придатним для великих мовних моделей. “Завдяки HBM3e NVIDIA H200 забезпечує 141 ГБ пам’яті зі швидкістю 4,8 терабайт в секунду, що майже вдвічі більше ємності й у 2,4 рази більше пропускної здатності в порівнянні з його попередником, NVIDIA A100”, – пише компанія.
Що стосується переваг для ШІ, NVIDIA заявляє, що HGX H200 подвоює швидкість виведення на Llama 2, моделі LLM з 70 мільярдами параметрів, у порівнянні з H100. Він буде доступний у 4-х та 8-ми смугових конфігураціях, сумісних як з програмним, так і з апаратним забезпеченням систем H100. Вона працюватиме в усіх типах центрів обробки даних (локальних, хмарних, гібридно-хмарних і периферійних) і розгортатиметься, зокрема, в Amazon Web Services, Google Cloud, Microsoft Azure та Oracle Cloud Infrastructure. Запуск запланований на 2 квартал 2024 року.
Іншим ключовим продуктом NVIDIA є “суперчіп” GH200 Grace Hopper, який об’єднує графічний процесор HGX H200 і процесор NVIDIA Grace на базі Arm з використанням інтерфейсу NVLink-C2C компанії. Він розроблений для суперкомп’ютерів, щоб дозволити “вченим і дослідникам вирішувати найскладніші проблеми у світі, прискорюючи складні додатки ШІ та HPC, що працюють з терабайтами даних”, – пише NVIDIA.
GH200 буде використовуватися в “40+ суперкомп’ютерах зі штучним інтелектом у світових дослідницьких центрах, системних виробниках і хмарних провайдерах”, в тому числі від Dell, Eviden, Hewlett Packard Enterprise (HPE), Lenovo, QCT і Supermicro, заявили в компанії. Серед них – суперкомп’ютери HPE Cray EX2500, які використовуватимуть чотири процесори GH200, масштабовані до десятків тисяч вузлів Grace Hopper Superchip.
Можливо, найбільшим суперкомп’ютером Grace Hopper буде JUPITER, розташований у Юліху в Німеччині, який стане “найпотужнішою у світі системою штучного інтелекту”, коли його буде встановлено у 2024 році. Він використовує архітектуру з рідинним охолодженням, “з бустерним модулем, що складається з майже 24 000 суперчіпів NVIDIA GH200, з’єднаних між собою мережевою платформою NVIDIA Quantum-2 InfiniBand”, згідно з NVIDIA.
NVIDIA каже, що JUPITER допоможе зробити науковий прорив у ряді областей, включаючи прогнозування клімату та погоди, створюючи кліматичні та погодні симуляції з високою роздільною здатністю та інтерактивною візуалізацією. Він також буде використовуватися для розробки ліків, квантових обчислень і промислового інжинірингу. У багатьох з цих областей використовуються спеціальні програмні рішення NVIDIA, які полегшують розробку, але також роблять суперкомп’ютерні групи залежними від апаратного забезпечення NVIDIA.
Нові технології стануть ключовими для NVIDIA, яка зараз отримує більшу частину свого доходу від сегментів ШІ та центрів обробки даних. Минулого кварталу компанія отримала рекордні $10,32 млрд доходу лише в цій галузі (з $13,51 млрд загального доходу), що на 171% більше, ніж рік тому. Вона, без сумніву, сподівається, що новий GPU і суперчіп допоможуть продовжити цю тенденцію. Лише минулого тижня NVIDIA побила свій власний рекорд у навчанні ШІ, використовуючи стару технологію H100, тому нова технологія повинна допомогти їй збільшити перевагу над конкурентами в секторі, в якому вона вже домінує.