Искусственный интеллект DiffusionGemma от Google достигает 1000 токенов в секунду — и это бесплатно

Опубликовано 11.06.2026

Вкратце

Google выпустила DiffusionGspanma, бесплатную модель с открытым весом, которая одновременно генерирует целые блоки из 256 токенов посредством распространения текста, обрабатывая более 1000 токенов в секунду на NVIDIA H100, что в четыре раза быстрее, чем стандартные модели авторегрессии.
Пользовательский модуль разработки, необходимый DiffusionGspanma для локального вывода, пока не существует ни в одной общедоступной среде выполнения — ни в mlx-lm, ни в LM Studio, — что делает его фактически неработающим на большинстве потребительских установок сегодня.
На NVIDIA NIM модель была предварительно настроена на 8192 токена контекста — ниже минимального уровня в 64 000 токенов, который требуется для агентских платформ, таких как Hermes Agent, — это означает, что автономные рабочие процессы не будут работать без ручной реконфигурации.

Сегодня Google отказался от DiffusionGspanma, ИИ с открытой моделью, который генерирует текст так же, как генераторы изображений создают изображения: начните с шума, улучшайте, пока он не обретет смысл. На NVIDIA H100 он достигает 1000 токенов в секунду. (Токены — это базовая единица информации, которую обрабатывает модель ИИ.) Это означает, что она в четыре раза быстрее, чем обычная Gspanma. Это также бесплатно, Apache 2.0, с весами на Hugging Face.

Подвох, как всегда, кроется в мелком шрифте. Согласно объявлению Google, модель достигает «700+ токенов в секунду на NVIDIA GeForce RTX 5090». По качеству вывода он также уступает стандартной Gspanma 4.

Google сам так говорит. Это скоростная модель, а не качественный апгрейд.

Что это на самом деле делает

Каждый LLM, которым вы пользовались, — это пишущая машинка. По одному жетону за раз, каждое слово зависит от последнего. Вот как работают авторегрессионные архитектуры.

DiffusionGspanma этого не делает. Вместо последовательной генерации токенов он начинается с параллельной обработки фрагментов искаженного текста. Согласно руководству для разработчиков Google, он «начинается с набора случайных токенов-заполнителей» и итеративно фиксирует надежные токены, пока весь блок не окажется в фокусе. Двести пятьдесят шесть жетонов за один проход вперед. Графический процессор остается занятым.

Побочным эффектом является двунаправленное внимание — каждый токен может видеть любой другой токен во время генерации, что невозможно в авторегрессионных моделях (они не могут видеть будущее, то, что будет закодировано). Это делает его необычайно хорошим для задач, где конец ответа ограничивает начало: заполнение кода, структурированный вывод, проблемы с тяжелыми ограничениями и т. д. Google доработал версию для решения судоку в качестве демонстрационной версии. Базовая модель правильно решила примерно 0% головоломок.

Доработанная версия достигла 80%.

Распространение текста уже много лет является исследовательским проектом. MDLM, SEDD, LLaDA, Dream — академические модели, доказавшие, что этот подход работает в небольших масштабах и в основном остается доказательством концепций. Inception Labs выпустила Mercury 2 в феврале 2026 года как первую коммерческую модель диффузионного рассуждения, заявив, что скорость в пять раз выше, чем у конкурентов, оптимизированных по скорости.

Но ничто из этого не было открытым, и ничто из этого не имело поддержки с нуля в vLLM, Hugging Face Transformers и Unsloth. DiffusionGspanma — это первый крупный открытый релиз, выпущенный лабораторией первого уровня.

Стоит отметить и историческую иронию. Генераторы изображений начинались как модели диффузии (отсюда и название «Стабильная диффузия»), а теперь переходят к авторегрессионной архитектуре для лучшего качества. Языковые модели начинались как авторегрессионные, а сейчас экспериментируют с распространением ради скорости.

Почему больно бежать… пока

Для эффективного запуска DiffusionGspanma требуется составитель — легкий модуль, который параллельно предлагает блоки токенов, которые затем проверяет основная модель за один прямой проход. Это называется спекулятивным декодированием. DFlash — это фреймворк, опубликованный в начале 2026 года, в котором в качестве средства разработки используется небольшая диффузная модель, что позволяет ускорить выполнение некоторых задач более чем в 6 раз. Именно двигатель делает модели этого класса практичными.

Проблема: DiffusionGspanma нужен специальный редактор для локального запуска через MLX — платформу машинного обучения Apple для Apple Silicon. Этот модуль не существует ни в одной общедоступной версии mlx-lm, ни в одном открытом запросе на вытягивание, ни в встроенной среде выполнения LM Studio.

Мы попробовали запустить DiffusionGspanma с Hermes через NVIDIA NIM. Модель загрузилась, но затем: «Ошибка инициализации агента: модель google/diffusiongspanma-26b-a4b-it имеет контекстное окно из 8 192 токенов, что ниже минимума в 64 000, необходимого для агента Hermes».

Если быть точным: фактическое контекстное окно DiffusionGspanma состоит из 256 тысяч токенов. Цифра в 8192 — это ошибка Nvidia по умолчанию, а не архитектурный предел модели.

На практике правильная настройка для агентского использования требует ручной работы, с которой большинство обычных пользователей еще не разобрались, и без нее агент Hermes просто не будет инициализироваться. Параллельная скорость ничего не значит, если агент не может загрузиться.

Будем надеяться, что в ближайшие несколько дней сообщество предоставит более качественные ресурсы для запуска этих моделей.

Для кого это вообще

Разработчики с оборудованием NVIDIA RTX 4090 или 5090 создают инструменты реального времени — встроенные редакторы, автозаполнение, заполнение кода, структурированную генерацию. Это цель. Как писал Decrypt в мае, Google постоянно стремится ускорить локальный вывод без нового оборудования.

Для исследователей двунаправленная генерация открывает территорию, которую модели авторегрессии просто не могут достичь — белковые последовательности, математические графики, все, где позиция N зависит от позиции N+50. Это не мелочь.

В апреле Google запустила Gspanma 4 под управлением Apache 2.0, а DiffusionGspanma продолжает эту стратегию. На сегодняшний день уже открыт проект PR-заявки на llama.cpp. Когда набор инструментов наверстает упущенное, он достигнет гораздо более широкой аудитории.

На машине с мощным дискретным графическим процессором скорость 1000 токенов в секунду вполне реальна.

Пакетные услуги

Онлайн решениеСрочное решение

Подробнее

Ипотека «Покупка нежилой недвижимости» | АО «Россельхозбанк»
Сумма:
до 30 млн. ₽
Ставка:
19,2% - 20,2 %
Срок ипотеки:
до 15 лет
Первый взнос:
от 20%
ПСК:
19,917 % - 25,938 %
Описание компании: АО «Россельхозбанк» — универсальный государственный банк, стабильно работающий на финансовом рынке России более 20 лет, входит в топ крупнейших банков страны по объему активов, размеру кредитного портфеля и широте региональной сети.

Основной фокус банка направлен на развитие сельского хозяйства и региональной экономики, при этом активно развиваются ипотечные и инвестиционные продукты, включая кредитование на покупку нежилой недвижимости, рассчитанное на физических лиц, индивидуальных предпринимателей и бизнес-сегмент.
Актуальные тарифы: ставка по ипотеке на покупку нежилой недвижимости в Россельхозбанке составляет от 19,2% до 20,2% годовых в зависимости от наличия добровольного страхования жизни, при этом полная стоимость кредита (ПСК) варьируется от 19,917% до 25,938% годовых.

Максимальная сумма кредита — до 30 млн рублей (до 4 млн для кладовых и машино-мест), срок до 15 лет, минимальный первоначальный взнос от 20% (от 40% при покупке кладовых или машино-мест).
Условия ипотечного кредитования: приобретаемая недвижимость должна быть капитальным строением без обременений, расположенным в Москве, Московской области или Санкт-Петербурге на цокольных, первых или вторых этажах многоквартирных домов.

Для машино-мест и кладовок допустимо расположение в многоэтажных домах или гаражных комплексах, объект оформляется в залог, также допускается дополнительное обеспечение в виде участка или другой недвижимости.
Опции ипотечной программы: доступны аннуитетные платежи, полное или частичное досрочное погашение без комиссий в дату очередного платежа, выбор страхования жизни влияет на ставку, имущественное страхование обязательно.

Программа подходит для индивидуальных предпринимателей, самозанятых, владельцев ЛПХ, а также официально трудоустроенных топ-менеджеров.
Требования к заемщику: возраст от 21 до 65 лет к моменту полного погашения кредита, при этом возможен срок до 75 лет при условии, что к 65-летию заемщик погасит не менее половины срока кредита.

Объект и заемщик должны находиться в одном регионе присутствия банка, допускается до 3 созаёмщиков, супруг автоматически становится со-заёмщиком, при наличии брачного договора возможно его исключение из сделки.
Необходимые документы: для граждан, ведущих личное подсобное хозяйство, требуется запись в похозяйственной книге, срок ведения ЛПХ — не менее 12 месяцев, для наёмных работников — стаж от 3 месяцев на текущем месте и не менее 1 года общего за последние 5 лет.

Работающим пенсионерам, получающим пенсию через банк, требуется подтверждение стажа от 3 месяцев.
Подача заявки: осуществляется как онлайн, так и через офисы и партнёров банка, срок рассмотрения заявки — до 5 рабочих дней.

Решение по заявке действительно 90 дней на подбор объекта и 85 дней на заключение договора после оценки объекта недвижимости, комиссия за выдачу кредита отсутствует.
Средний рейтинг услуги и компании составляет 4,6 из 5, что объясняется стабильной работой банка на рынке, широкими возможностями по привлечению со-заёмщиков, прозрачными условиями и надёжностью государственного финансового учреждения.

ипотека без господдержки ипотека для бизнеса ипотека для ИП ипотека на коммерческую недвижимость ипотека Россельхозбанк ипотека с первоначальным взносом кладовые в ипотеку коммерческая ипотека машиноместа в ипотеку нежилая недвижимость в новостройке первичный рынок коммерческой недвижимости покупка нежилой недвижимости срок ипотеки на нежилую недвижимость ставка по ипотеке на коммерческую недвижимость условия ипотеки на нежилую недвижимость
Онлайн решениеИностранцам

Подробнее

ДМС «Страхование от критических заболеваний» | ПАО СК “Росгосстрах”
Возраст:
1 – 64 года
Стоимость:
25 200 000 ₽
Сумма покрытия:
4 430 ₽ - 13 200 ₽
Описание компании: ПАО СК “Росгосстрах” — одна из крупнейших страховых организаций в России, ведущая деятельность более 90 лет и специализирующаяся на комплексной защите жизни и здоровья, включая страхование от критических заболеваний, с широкой офисной сетью по всей стране и высоким уровнем цифровизации обслуживания.
Актуальные тарифы: стоимость полиса ДМС от критических заболеваний варьируется от 4 430 ₽ до 13 200 ₽ в зависимости от возраста застрахованного, срока действия и выбранного уровня покрытия, при этом предоставляется страховая сумма до 25 200 000 ₽, включая единовременную выплату 200 000 ₽ при первичном диагнозе.
Условия: полис доступен для физических лиц в возрасте от 1 до 64 лет, срок страхования составляет 6 или 12 месяцев, пролонгация возможна без возрастных ограничений, а страховое покрытие распространяется на все страны мира, за исключением США.
Опции: программа включает оплату лечения и медикаментов, организацию поездки, транспортировку и проживание, юридическую и психологическую помощь, подбор зарубежной клиники, визовую поддержку, оплату услуг переводчика и второе медицинское мнение, а также круглосуточные телефонные консультации с врачами.
Требования: оформление полиса не требует прохождения медицинского осмотра, однако вступление договора в силу сопровождается периодом ожидания в 120–180 дней, в зависимости от территории действия и вида заболевания, при этом подключение детей к полису не предусмотрено.
Документы: для заключения договора потребуется только паспортные данные и заполненная анкета, все остальные документы, включая подтверждение диагноза, предоставляются на этапе урегулирования страхового случая через личный кабинет или по электронной почте.
Подача заявки: оформление происходит онлайн — необходимо заполнить анкету на сайте, выбрать срок действия полиса, оплатить через платёжную систему, после чего полис будет отправлен на электронную почту, весь процесс занимает не более 10 минут.
Средний рейтинг программы ДМС от критических заболеваний от ПАО СК “Росгосстрах” составляет 4,6 звезды из 5, что обусловлено высокой суммой покрытия, расширенными опциями лечения за рубежом, оперативной выплатой и полной сопровождением застрахованных лиц.

Амбулаторное лечение Инсульты Инфаркты Медикаменты и анестезию нейрохирургия Онкология Протезирование и имплантация Психологическую поддержку Реабилитационное лечение Стационар Трансплантация костного мозга Хирургия на сердце
Доставка курьеромОнлайн решениеБез справокБез залога

Подробнее

Кредит «На отдых: наличные без справок и поручителей — нужен только паспорт» | АО «ТБанк»
Сумма:
10 000 ₽ - 5 млн. ₽
Ставка:
19,9% - 40%
ПСК:
19,880% - 39,895%
Срок кредита:
12 мес - 5 лет
Решение:
1 минута - 2 дня
Описание компании: АО «ТБанк» является одним из устойчивых игроков российского финансового сектора, работающим более трёх десятилетий и предоставляющим широкий спектр услуг для физических и юридических лиц, включая потребительские кредиты, ипотеку, рефинансирование и цифровые сервисы, что подтверждает его надёжность и значимость в экономике страны.
Актуальные тарифы: Кредит «На покупку отдых» предоставляется в сумме от 10 000 ₽ до 5 000 000 ₽, сроком от 12 до 60 месяцев, с фиксированной процентной ставкой в диапазоне 19,9%–40%, полной стоимостью кредита от 19,880% до 39,895%, без залога и поручителей, а решение принимается онлайн в течение 1 минуты–2 дней.
Условия: Первоначальный взнос отсутствует, страхование жизни и от потери работы предлагается добровольно, при отказе от страховки возможна надбавка 1–2%, допускается рефинансирование и объединение нескольких кредитов, а ежемесячное погашение осуществляется по аннуитетному графику без скрытых комиссий и штрафов за досрочное закрытие.
Опции: Клиентам доступны автоплатёж без комиссии, кредитные каникулы до 3 месяцев при подтверждении, реструктуризация задолженности, возможность получения средств на карту или наличными через банкомат, а также круглосуточная поддержка и мобильное приложение для управления кредитом.
Требования: Минимальный возраст заемщика составляет 18 лет, максимальный на момент погашения — 70 лет, доход от 15 000 ₽, стаж работы от 3 месяцев, допускается до 2 созаёмщиков, кредитная нагрузка не более 5 действующих кредитов, обязательна регистрация в регионе банка и наличие гражданства РФ.
Документы: Для оформления кредита требуется только паспорт РФ, подтверждение дохода не запрашивается, дополнительные справки и поручители не нужны, а для идентификации используется онлайн-верификация через Госуслуги или биометрию.
Подача заявки: Заявка подаётся онлайн или по телефону, решение принимается в срок от 1 минуты до 2 дней, одобрение действует до 30 дней, возможна предварительная проверка кредитоспособности, а заключение договора не требует визита в офис, что делает процесс максимально удобным и быстрым.
Средний рейтинг: 4,3 звезды из 5, что объясняется сочетанием прозрачных условий, удобных цифровых сервисов и высокой скорости принятия решений, при этом часть клиентов отмечает сравнительно высокую процентную ставку как фактор снижения оценки.

беззалоговый кредит кредит на отдых кредит наличными кредит только по паспорту онлайн кредит потребительский кредит целевой кредит

Искусственный интеллект DiffusionGemma от Google достигает 1000 токенов в секунду — и это бесплатно

Похожие посты

Пакетные услуги

Сравнить Условия (0 Вар.)