Генеральный директор Дженсен Хуанг вышел на сцену выставки CES в Лас-Вегасе, чтобы продемонстрировать новые предложения аппаратного и программного обеспечения, которые охватывают все: от персональных суперкомпьютеров с искусственным интеллектом до игровых карт нового поколения.
Самый крупный анонс Nvidia: Project DIGITS, персональный суперкомпьютер с искусственным интеллектом стоимостью 3000 долларов, который объединяет петафлопс вычислительной мощности в корпусе размером с настольный компьютер.
Построенная на основе нового — и до сих пор секретного — суперчипа GB10 Grace Blackwell, эта машина может обрабатывать модели искусственного интеллекта с числом до 200 миллиардов параметров, получая при этом питание от стандартной розетки.
Для более тяжелых рабочих нагрузок пользователи могут объединить два устройства для работы с моделями, содержащими до 405 миллиардов параметров.
Для сравнения: самая крупная модель Llama 3.2, самая продвинутая LLM с открытым исходным кодом от Meta, имеет 405 миллиардов параметров и не может быть запущена на потребительском оборудовании.
До сих пор для этого требовалось около 8 суперчипов Nvidia A100/H100, каждый из которых стоил около 30 тысяч долларов, а общая стоимость только аппаратного обеспечения составила более 240 тысяч долларов.
Два новых суперкомпьютера с искусственным интеллектом потребительского уровня от Nvidia будут стоить 6 тысяч долларов и смогут выполнять одну и ту же квантованную модель.
«ИИ станет мейнстримом во всех приложениях и во всех отраслях. Благодаря Project DIGITS суперчип Grace Blackwell станет доступен миллионам разработчиков», — заявил Дженсен Хуанг, генеральный директор Nvidia, в официальном сообщении в блоге. «Размещение суперкомпьютера искусственного интеллекта на столах каждого специалиста по данным, исследователя искусственного интеллекта и студента дает им возможность участвовать и формировать эпоху искусственного интеллекта».
Для тех, кто любит технические детали, чип GB10 представляет собой значительное инженерное достижение, созданное в результате сотрудничества с MediaTek.
Система на кристалле сочетает в себе новейшую архитектуру графического процессора Nvidia с 20 энергоэффективными ядрами ARM, соединенными через соединение NVLink-C2C.
Каждое устройство DIGITS оснащено 128 ГБ унифицированной памяти и хранилищем NVMe емкостью до 4 ТБ. Опять же, для контекста: самые мощные на сегодняшний день графические процессоры имеют около 24 ГБ видеопамяти (память, необходимая для запуска моделей искусственного интеллекта) каждый, а суперчип H100 начинается с 80 ГБ видеопамяти.
Планы Nvidia по доминированию над агентами искусственного интеллекта
Компании спешат внедрить агенты искусственного интеллекта, и Nvidia это знает, и, вероятно, именно поэтому она разработала Nspanotron, новое семейство моделей трех размеров, и объявила сегодня о своем расширении за счет двух новых моделей: Nvidia NIIM для обобщения и понимания видео и Nvidia Cosmos предоставит Nspanotron возможности видения — способность понимать визуальные инструкции.
До сих пор LLM были только текстовыми. Однако модели преуспели в следующих инструкциях: чат, вызовы функций, программирование и математические задачи.
Они доступны как на Hugging Face, так и на веб-сайте Nvidia, а корпоративный доступ осуществляется через программную платформу AI Enterprise компании.
Опять же, для контекста: на арене LLM Llama Nspanotron 70b от Nvidia занимает более высокое место, чем оригинальная Llama 405b, разработанная Meta. Он также превосходит различные версии Claude, Gspanini Advanced, Grok-2 mini и GPT-4o.
Агентское продвижение Nvidia теперь также связано с инфраструктурой. Компания объявила о партнерстве с крупными поставщиками агентских технологий, такими как LangChain, LlamaIndex и CrewAI, для создания проектов на базе Nvidia AI Enterprise.
Эти готовые к развертыванию шаблоны решают конкретные задачи, которые упрощают разработчикам создание узкоспециализированных агентов.
Новый проект преобразования PDF в подкаст призван конкурировать с Google NotebookLM, а другой проект помогает создавать агенты поиска видео и сводки. Разработчики могут протестировать эти проекты с помощью новой платформы Nvidia Launchables, которая позволяет создавать прототипы и развертывать их одним щелчком мыши.
Геймеры, ликуйте! Новые карты GeForce RTX 5000 — монстр производительности
Nvidia оставила свои игровые анонсы напоследок, представив долгожданную серию GeForce RTX 5000. Флагманский процессор RTX 5090 содержит 92 миллиарда транзисторов и выполняет 3352 триллиона операций искусственного интеллекта в секунду, что вдвое превышает производительность текущего RTX 4090. Вся линейка включает тензорные ядра пятого поколения и ядра RT четвертого поколения.
В новых картах реализована технология DLSS 4, которая может повысить частоту кадров до 8 раз за счет использования искусственного интеллекта для генерации нескольких кадров за рендеринг. Blackwell, движок искусственного интеллекта, стал доступен геймерам, разработчикам и креативщикам на ПК, — сказал Дженсен Хуанг. — Объединяя нейронный рендеринг на основе искусственного интеллекта и трассировку лучей, Blackwell является самой значительной инновацией в области компьютерной графики с тех пор, как мы представили программируемое затенение 25 лет назад. »
В новых картах также используются модели-трансформеры для сверхвысокого разрешения, обещающие очень реалистичную графику и гораздо большую производительность за свою цену, которая, кстати, недешевая: 549 долларов за RTX 5070, 5070 Ti за 749 долларов, 5080 за 999 долларов, и 5090 по цене 1999 долларов.
Если у вас нет таких денег и вы хотите поиграть, не волнуйтесь.
AMD также анонсировала сегодня свою серию Radeon RX 9070. Карты построены на новой архитектуре RDNA 4 с использованием 4-нм производственного процесса и оснащены специальными ускорителями искусственного интеллекта, способными конкурировать с тензорными ядрами Nvidia.
Хотя полные характеристики остаются в секрете, последние AI-чипы AMD Ryzen уже достигают 50 TOPS при максимальной производительности.
К сожалению, Nvidia по-прежнему остается королем приложений искусственного интеллекта благодаря своей технологии CUDA, собственной архитектуре искусственного интеллекта Nvidia.
Чтобы решить эту проблему, AMD заключила партнерские отношения с HP и Asus для системной интеграции, и до 2025 года более 100 брендов корпоративных платформ будут использовать технологию AMD Pro.
Ожидается, что карты Radeon появятся на рынке в первом квартале 2025 года, что предоставит Nvidia интересную битву как в играх, так и в ускорении искусственного интеллекта.
Под редакцией Себастьяна Синклера
