Gemini 3 Flash завоевывает трон: новая модель Google бросает вызов OpenAI с быстротой, экономичностью и безкомпромиссной производительностью

2026-01-12 08:28:33

Google ufficialmente запустила Gemini 3 Flash, позиционируя его как модель по умолчанию на всей глобальной платформе Gemini. Этот дебют представляет собой значительное ускорение в технологической гонке с OpenAI, при этом компания из Маунтин-Вью уже обрабатывает более 1 триллиона токенов в день через свой API.

Производительность, которая поражает: цифры говорят сами за себя

То, что делает этот запуск интересным, — это не только скорость — тема, которая будет часто возвращаться, — а также бенчмарки, которые развенчивают любые сомнения. В тесте Humanity’s Last Exam Gemini 3 Flash набрал 33,7%, практически совпадая с GPT-5.2 (34,5%) и недалеко от Pro от Google (37,5%). В чем разница? Flash стоит значительно дешевле и работает быстрее.

Но настоящий нокаут достигается с MMMU-Pro, бенчмарком мультимодального рассуждения, где новая модель побеждает конкурентов с результатом 81,2%, буквально превосходя всех соперников. Эти цифры — не просто числа на бумаге: они означают, что вы можете загрузить видео, аудио, рисунок и получить сложные ответы без ожидания минут.

Скорость как конкурентное оружие: селектор скорости в службе пользователей

Google сознательно подчеркнула важный аспект: новая модель в три раза быстрее Gemini 2.5 Pro. Это не только технический показатель, а реальный опыт. Приложение Gemini теперь предлагает встроенный селектор скорости: вы можете использовать Flash почти для всего — видеоанализ, извлечение данных, визуальное рассуждение — без компромиссов по качеству, или выбрать модель Pro для сложных вопросов программирования или математики.

Эта гибкость продумана стратегически. Для задач рассуждения новая модель использует на 30% меньше токенов по сравнению с 2.5 Pro, что приводит к реальной экономии для компаний, даже если цена за токен немного выросла.

Цена рассказывает историю: экономическая эффективность

Gemini 3 Flash стоит $0,50 за 1 миллион входных токенов и $3,00 за 1 миллион выходных токенов, по сравнению с $0,30 и $2,50 у предыдущей модели. Очевидный вопрос: почему платить больше?

Ответ скрыт в сочетании скорости и эффективности. Если модель в три раза быстрее и использует на 30% меньше токенов для определенных задач, общая стоимость транзакции может действительно снизиться. Тулси Доши, старший директор по продукту Gemini, подчеркнул, что «Flash — это рабочая модель» для компаний, которым нужно обрабатывать огромные объемы запросов. Это не самая умная модель, а самая экономичная.

Уже в производстве: JetBrains, Figma, Harvey не ждут

Google не говорит о будущих возможностях, а о текущей реальности. Такие компании, как JetBrains, Figma, Cursor, Harvey и Latitude, уже используют Gemini 3 Flash через Vertex AI и Gemini Enterprise. Для разработчиков модель доступна в предварительном просмотре через API и в Antigravity, инструменте программирования, запущенном в прошлом месяце.

В проверенном бенчмарке SWE-bench для программирования модель достигает 78%, уступая только GPT-5.2. Это означает, что она достаточно сложна для реальных задач кодирования, хотя и не лучшая для сложных алгоритмов и пограничных оптимизаций.

Контекст AI-войны: что действительно происходит

Этот запуск не происходит из ниоткуда. Недели назад Сэм Альтман отправил внутреннюю мемо «Code Red», потому что трафик ChatGPT снижался, а доля Google среди потребителей росла. OpenAI ответила выпуском GPT-5.2 и новыми генеративными моделями изображений, похваставшись ростом объема сообщений в 8 раз с ноября 2024 года.

Google прямо не участвует в этой полемике. Доши предпочла дипломатичный тон: «То, что происходит, — это то, что все эти модели продолжают быть выдающимися, соревнуются друг с другом, расширяют границы. И я считаю, что здорово, что компании выпускают эти модели.»

Перевод: да, идет жесткая конкуренция, но Google считает ее положительным стимулом для инноваций.

Глобальная доступность: модель по умолчанию уже сегодня

Gemini 3 Flash заменяет Gemini 2.5 Flash как модель по умолчанию в приложении Gemini и в AI-поиске. Глобальные пользователи ничего не должны делать: они сразу увидят новую модель. Для тех, кто предпочитает модель Pro, она остается доступной в меню.

Модель уже доступна в США для поиска, с глобальным запуском в процессе. Приложение поддерживает загрузку видео, аудио, эскизов, документов — модель их обрабатывает и генерирует анализ, викторины, советы, таблицы.

Gemini 3 Flash — не самая мощная модель в абсолюте, но самая умная с точки зрения экономики и скорости. В соревновании, где все участники получают схожие технические очки, побеждает тот, кто быстрее достигает результата по самой выгодной цене. Именно этот селектор выбрала Google для дифференциации.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .