Google офіційно запустила Gemini 3 Flash, позиціонуючи його як стандартну модель у всій глобальній платформі Gemini. Це дебют означає значне прискорення у технологічній гонці з OpenAI, оскільки компанія з Маунтін-В’ю вже обробляє понад 1 трильйон токенів на день через свій API.
Вражаючі результати: цифри говорять самі за себе
Що робить цей запуск цікавим, так це не лише швидкість—тема, яка буде часто підніматися,—а й бенчмарки, що спростовують будь-які сумніви. У тесті Humanity’s Last Exam Gemini 3 Flash набрав 33,7%, що практично відповідає GPT-5.2 (34,5%) і недалеко від Pro від Google (37,5%). В чому різниця? Flash коштує набагато менше і швидший.
Але справжній нокаут приходить з MMMU-Pro, бенчмарком мультимодального мислення, де нова модель знищує конкуренцію з показником 81,2%, буквально перевершуючи всіх конкурентів. Це не просто цифри на папері: це означає, що ви можете завантажити відео, аудіо, малюнок і отримати складні відповіді без очікування кількох хвилин.
Швидкість як конкурентна зброя: селектор швидкості для користувачів
Google навмисно підкреслив важливий аспект: нова модель у три рази швидша за Gemini 2.5 Pro. Це не лише технічна метрика, а реальний досвід. Додаток Gemini тепер має вбудований селектор швидкості: ви можете використовувати Flash для майже всього—відеоаналізу, витягання даних, візуального мислення—без компромісів у якості, або обрати модель Pro для складних програмних або математичних запитів.
Ця гнучкість стратегічно продумана. Для задач мислення нова модель використовує на 30% менше токенів порівняно з 2.5 Pro, що дає реальні економічні переваги для компаній, навіть якщо ціна за токен трохи зросла.
Ціна розповідає історію: економічна ефективність
Gemini 3 Flash коштує $0,50 за 1 мільйон вхідних токенів і $3,00 за 1 мільйон вихідних токенів, порівняно з $0,30 і $2,50 відповідно у попередньої моделі. Очевидне питання: чому платити більше?
Відповідь у поєднанні швидкості та ефективності. Якщо модель у три рази швидша і використовує на 30% менше токенів для певних задач, загальні витрати на транзакцію можуть фактично знизитися. Тулсі Доші, старший директор продукту Gemini, підкреслив, що “Flash—це робоча модель” для компаній, які мають справу з великими обсягами запитів. Це не найрозумніша модель, але найрозумніша з економічної точки зору.
Вже у виробництві: JetBrains, Figma, Harvey не чекають
Google не говорить про майбутні можливості, а про реальність сьогодення. Компанії як JetBrains, Figma, Cursor, Harvey і Latitude вже використовують Gemini 3 Flash через Vertex AI і Gemini Enterprise. Для розробників модель доступна в попередньому перегляді через API і в Antigravity, інструменті програмування, запущеному минулого місяця.
У бенчмарку SWE-bench, підтвердженому для програмування, модель отримує 78%, поступаючись лише GPT-5.2. Це означає, що вона достатньо складна для реальних задач кодування, хоча й не найкращий вибір для складних алгоритмів і граничних оптимізацій.
Контекст війни AI: що насправді відбувається
Цей запуск не з’явився з нічого. Тижнями раніше Сем Альтман надіслав внутрішню мемо “Code Red”, оскільки трафік ChatGPT знижувався, тоді як частка Google серед споживачів зростала. OpenAI відповіла випуском GPT-5.2 і нових генеративних моделей зображень, хвалячись зростанням обсягу повідомлень у 8 разів з листопада 2024 року.
Google прямо не втручається у цю суперечку. Доші обрала дипломатичний тон: “Що відбувається, так це те, що всі ці моделі продовжують бути надзвичайними, змагаються між собою, розширюють межі. І я вважаю, що це чудово, що компанії випускають ці моделі.”
Переклад: так, конкуренція жорстка, але Google легітимізує її як позитивний стимул для інновацій.
Глобальна доступність: стандартна модель вже сьогодні
Gemini 3 Flash замінює Gemini 2.5 Flash як стандарт у додатку Gemini і в пошуку AI. Глобальні користувачі нічого не повинні робити: вони одразу побачать нову модель. Для тих, хто віддає перевагу моделі Pro, вона залишається доступною з меню.
Модель вже доступна у США для пошуку, з глобальним розгортанням у процесі. Додаток підтримує завантаження відео, аудіо, малюнків, документів—модель їх обробляє і генерує аналізи, тести, поради, таблиці.
Gemini 3 Flash не є найпотужнішою моделлю взагалі, але є найрозумнішою з точки зору економічної ефективності та швидкості. У змаганні, де всі учасники мають схожі технічні показники, перемагає той, хто швидше дає результат за найвигіднішою ціною. Це селектор, який Google обрав для відрізнення.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Gemini 3 Flash завойовує трон: новий модель Google кидає виклик OpenAI швидкістю, економічністю та безкомпромісною продуктивністю
Google офіційно запустила Gemini 3 Flash, позиціонуючи його як стандартну модель у всій глобальній платформі Gemini. Це дебют означає значне прискорення у технологічній гонці з OpenAI, оскільки компанія з Маунтін-В’ю вже обробляє понад 1 трильйон токенів на день через свій API.
Вражаючі результати: цифри говорять самі за себе
Що робить цей запуск цікавим, так це не лише швидкість—тема, яка буде часто підніматися,—а й бенчмарки, що спростовують будь-які сумніви. У тесті Humanity’s Last Exam Gemini 3 Flash набрав 33,7%, що практично відповідає GPT-5.2 (34,5%) і недалеко від Pro від Google (37,5%). В чому різниця? Flash коштує набагато менше і швидший.
Але справжній нокаут приходить з MMMU-Pro, бенчмарком мультимодального мислення, де нова модель знищує конкуренцію з показником 81,2%, буквально перевершуючи всіх конкурентів. Це не просто цифри на папері: це означає, що ви можете завантажити відео, аудіо, малюнок і отримати складні відповіді без очікування кількох хвилин.
Швидкість як конкурентна зброя: селектор швидкості для користувачів
Google навмисно підкреслив важливий аспект: нова модель у три рази швидша за Gemini 2.5 Pro. Це не лише технічна метрика, а реальний досвід. Додаток Gemini тепер має вбудований селектор швидкості: ви можете використовувати Flash для майже всього—відеоаналізу, витягання даних, візуального мислення—без компромісів у якості, або обрати модель Pro для складних програмних або математичних запитів.
Ця гнучкість стратегічно продумана. Для задач мислення нова модель використовує на 30% менше токенів порівняно з 2.5 Pro, що дає реальні економічні переваги для компаній, навіть якщо ціна за токен трохи зросла.
Ціна розповідає історію: економічна ефективність
Gemini 3 Flash коштує $0,50 за 1 мільйон вхідних токенів і $3,00 за 1 мільйон вихідних токенів, порівняно з $0,30 і $2,50 відповідно у попередньої моделі. Очевидне питання: чому платити більше?
Відповідь у поєднанні швидкості та ефективності. Якщо модель у три рази швидша і використовує на 30% менше токенів для певних задач, загальні витрати на транзакцію можуть фактично знизитися. Тулсі Доші, старший директор продукту Gemini, підкреслив, що “Flash—це робоча модель” для компаній, які мають справу з великими обсягами запитів. Це не найрозумніша модель, але найрозумніша з економічної точки зору.
Вже у виробництві: JetBrains, Figma, Harvey не чекають
Google не говорить про майбутні можливості, а про реальність сьогодення. Компанії як JetBrains, Figma, Cursor, Harvey і Latitude вже використовують Gemini 3 Flash через Vertex AI і Gemini Enterprise. Для розробників модель доступна в попередньому перегляді через API і в Antigravity, інструменті програмування, запущеному минулого місяця.
У бенчмарку SWE-bench, підтвердженому для програмування, модель отримує 78%, поступаючись лише GPT-5.2. Це означає, що вона достатньо складна для реальних задач кодування, хоча й не найкращий вибір для складних алгоритмів і граничних оптимізацій.
Контекст війни AI: що насправді відбувається
Цей запуск не з’явився з нічого. Тижнями раніше Сем Альтман надіслав внутрішню мемо “Code Red”, оскільки трафік ChatGPT знижувався, тоді як частка Google серед споживачів зростала. OpenAI відповіла випуском GPT-5.2 і нових генеративних моделей зображень, хвалячись зростанням обсягу повідомлень у 8 разів з листопада 2024 року.
Google прямо не втручається у цю суперечку. Доші обрала дипломатичний тон: “Що відбувається, так це те, що всі ці моделі продовжують бути надзвичайними, змагаються між собою, розширюють межі. І я вважаю, що це чудово, що компанії випускають ці моделі.”
Переклад: так, конкуренція жорстка, але Google легітимізує її як позитивний стимул для інновацій.
Глобальна доступність: стандартна модель вже сьогодні
Gemini 3 Flash замінює Gemini 2.5 Flash як стандарт у додатку Gemini і в пошуку AI. Глобальні користувачі нічого не повинні робити: вони одразу побачать нову модель. Для тих, хто віддає перевагу моделі Pro, вона залишається доступною з меню.
Модель вже доступна у США для пошуку, з глобальним розгортанням у процесі. Додаток підтримує завантаження відео, аудіо, малюнків, документів—модель їх обробляє і генерує аналізи, тести, поради, таблиці.
Gemini 3 Flash не є найпотужнішою моделлю взагалі, але є найрозумнішою з точки зору економічної ефективності та швидкості. У змаганні, де всі учасники мають схожі технічні показники, перемагає той, хто швидше дає результат за найвигіднішою ціною. Це селектор, який Google обрав для відрізнення.