Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5 Mini

Сводка

Сравнение benchmark Gemini 3 Flash Preview vs GPT-5 Mini: GPT-5 Mini лидирует по среднему баллу: 8.5 vs 7.4. Gemini 3 Flash Preview имеет более низкую стоимость benchmark: $0.111 vs $0.159. Gemini 3 Flash Preview быстрее: 5.76s vs 23.64s, с долей успешных попыток 79.4% vs 63.5%.

Рекомендуемая модель: Gemini 3 Flash Preview - Он дает лучший общий компромисс: конкурентный балл (7.4), ниже стоимость, чем у GPT-5 Mini, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика Gemini 3 Flash Preview Gemini 3 Flash Preview low Релиз: 2025-12-17 GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07
Оценка 7.4 8.5
Ранг #53 #19
Надежность 10.0 10.0
Стабильность 9.2 9.1
Тестов верно
Доля успешных попыток 79.4% 63.5%
Нестабильные тесты 2 2
Всего запусков 63 63
Стоимость за результат 0.689 1.319
Общая стоимость $0.111 $0.159
Цена входа $0.500 / 1M $0.250 / 1M
Цена выхода $3.000 / 1M $2.000 / 1M
Общее число входных токенов 36,769 37,100
Выходные токены 2,076 6,801
Токены рассуждений 28,518 67,690
Время ответа (среднее) 5.76s 23.64s
Время ответа (макс.) 14.72s 88.15s
Время ответа (суммарно) 120.93s 496.44s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 Gemini 3 Flash Preview

low
Cost
$0.007
Time
12.1s
Tokens
2,289 tok

#19 GPT-5 Mini

medium
Cost
$0.007
Time
42.9s
Tokens
3,432 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 500 281 3,082
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 606 1,715 6,378
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 5.8 7.2 44.4% 1 6.00s 8,122 456 7,421
GPT-5 Mini 10.0 10.0 100.0% 0 27.63s 7,302 658 17,152
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 12,860 326 0
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 14,118 754 11,520
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 7,261 279 3,656
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 7,140 453 3,200
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 645 12 6,410
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 515 293 14,016
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 492 120 981
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 477 349 1,856
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 621 71 2,752
GPT-5 Mini 10.0 10.0 100.0% 0 11.59s 660 310 3,968
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.77s 562 288 3,168
GPT-5 Mini 5.6 9.8 33.3% 0 15.20s 642 1,622 6,144
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 5,550 234 415
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 5,445 487 1,600
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 2.75s 156 9 633
GPT-5 Mini 3.0 10.0 0.0% 0 9.99s 195 160 1,856

Быстрое сравнение

Сменить пару сравнения